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全 国 计 算 机 技术 与 软件 专业 技术 资格 水平 ) 考试 实施 至 今 已 经 历 了 二 十 余年 ， 在 社会 上 
产生 了 很 大 的 影响 ， 对 我 国 软件 产业 的 形成 和 发 展 做 出 了 重要 的 贡献 。 为 了 适应 我 国 计 算 机 信 
息 技术 发 展 的 需求 ， 人 力 资源 和 社会 保障 部 、 工 业 和 信息 化 部 决定 将 考试 的 级 别 拓展 到 计算 机 
信息 技术 行业 的 各 个 方面 ， 以 满足 社会 上 对 各 种 计算 机 信息 技术 人 才 的 需要 。 

编者 受 全 国 计 算 机 专业 技术 资格 考试 办 公 室 委托 ， 对 《软件 设计 师 教程 (第 4 版 )》 进 行 
改写 ， 以 适应 新 的 考试 大 纲要 求 。 在 考试 大 纲 中 ， 要 求 考生 掌握 的 知识 面 很 广 ， 每 个 章节 的 内 
容 都 能 构成 相关 领域 的 一 门 甚至 多 门 课程 ， 因 此 编写 的 难度 很 高 。 考 虑 到 参加 考试 的 人 员 已 有 
一 定 的 基础 , 所 以 本 书 中 只 对 考试 大 纲 中 所 涉及 的 知识 领域 的 要 点 加 以 阐述 , 但 限于 篇 幅 所 限 ， 
不 能 详细 地 展开 ， 请 读者 谅解 。 

全 书 共 分 12 章 ， 各 章节 内 容 安排 如 下 : 

第 1 章 主要 介绍 计算 机 系统 基础 知识 、 计 算 机 体系 结构 以 及 安全 性 、 可 靠 性 和 系统 性 能 评 
测 基 础 。 

第 2 章 主要 介绍 程序 设计 语言 的 基本 概念 与 基本 成 分 ， 曾 述 了 汇编 程序 、 编 译 程序 与 解释 
程序 的 基本 原理 。 

第 3 章 主要 介绍 数据 结构 的 基础 知识 ， 包 括 线性 结构 、 数 组 、 广 义 表 、 树 和 图 ， 以 及 查找 
和 排序 的 基本 算法 。 

第 4 章 主要 介绍 操作 系统 基本 概念 与 分 类 及 特点 、 进 程 管理 、 存 储 管理 、 设 备 管理 、 文 件 
管理 、 作 业 管 理 等 。 

第 5 章 主要 介绍 软件 工程 中 软件 过 程 与 过 程 模型 、 需 求 分 析 与 需求 工程 、 系 统 设 计 、 系 统 
测试 、 系 统 运行 与 维护 、 软 件 项 目 管理 、 软 件 质量 、 软 件 度量 、 软 件 工具 与 软件 开发 环境 基础 
知识 。 

第 6 章 主要 介绍 系统 分 析 与 设计 、 结 构 化 分 析 与 设计 、Web 应 用 系统 分 析 与 设计 、 用 户 界 
面 设计 基础 知识 。 

第 7 章 主要 介绍 面向 对 象 的 基本 概念 和 面向 对 象 开发 技术 , 包括 面向 对 象 的 分 析 与 设计 方 
法 ，UML 以 及 设计 模式 的 概念 和 应 用 。 

第 8 章 主要 介绍 算法 设计 与 分 析 的 基本 概念 , 包括 分 治 法 、 动 态 规划 法 、 贫 心 法 、 回 淹 法 、 
分 支 界限 法 、 概 率 算 法 、 近 似 算法 、 数 据 挖掘 算法 及 智能 优化 算法 。 
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第 9 章 主要 介绍 数据 库 的 基本 概念 、 数 据 模型 、 关 系 代数 、SQL 语言 、 规 范 化 理论 和 事务 
LE 等 控制 功能 。 

第 10 章 主 要 介绍 网 络 与 信息 安全 基础 知识 ， 包 括 网 络 体系 结构 、 网 络 互 连 设备 、 网 络 构 
件 、 网 络 协议 、 网 络 应 用 、 信 息 安全 和 网 络 安全 方面 的 基础 知识 。 

第 11 章 主要 介绍 标准 化 与 知识 产权 基础 知识 。 

第 12 章 主 要 介绍 结构 化 分 析 与 设计 、 数 据 库 分 析 与 设计 、 面 向 对 象 分 析 与 设计 、 算 法 分 
析 与 设计 以 及 面向 过 程 、 面 向 对 象 的 程序 设计 与 实现 。 

本 书 第 1 章 由 张 淑 平 、 马 志 欣 编写 ， 第 2 章 由 张 淑 平 编写 ， 第 3 章 由 张小平 、 陈 静 玉 、 宋 
胜利 编写 ， 第 4 章 由 王 亚 平 编写 ， 第 5 章 、 第 6 章 、 第 7 章 由 霍 秋 艳 、 褚 华 编写 ， 第 8 章 由 覃 
桂 敏 、 褚 华 编写 ， 第 9 章 由 王 亚 平 编写 ， 第 10 章 由 严 体 华 编写 ， 第 11 章 由 刘强 编写 ， 第 12 
章 由 王 亚 平 、 褚 华 、 霍 秋 艳 、 覃 桂 敏 、 张 淑 平 编写 ， 最 后 由 霍 秋 艳 、 褚 华 统 稿 。 

在 本 书 的 编写 过 程 中 ， 参 考 了 许多 相关 的 书籍 和 资料 ， 编 者 在 此 对 这 些 参考 文献 的 作者 表 
示 感 谢 。 同 时 感谢 清华 大 学 出 版 社 在 本 书 出 版 过 程 中 所 给 予 的 支持 和 帮助 。 

因 水 平 有 限 ， 书 中 难免 存在 从 妥 之 处 ， 望 读者 指正 ， 以 利 改进 和 提高 。 
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1.1 计算 机 系统 基础 知识 


1.1.1 计算 机 系统 硬件 基本 组 成 


计算 机 系统 是 由 硬件 和 软件 组 成 的 ， 它 们 协同 工作 来 运行 程序 。 计 算 机 的 基本 硬件 系统 由 
运算 器 、 控 制 器 、 存 储 器 、 输 入 设备 和 输出 设备 5 大 部 件 组 成 。 运 算 器 、 控 制 器 等 部 件 被 集成 
在 一 起 统称 为 中 央 处 理 单元 (Central Processing Unit，CPU) 。CPU 是 硬件 系统 的 核心 ， 用 于 
数据 的 加 工 处 理 ,能 完成 各 种 算术 、 风 辑 运 算 及 控制 功能 。 存储 器 是 计算 机 系统 中 的 记忆 设备 ， 
分 为 内 部 存储 器 和 外 部 存储 器 。 前 者 速度 高 、 容 量 小 ， 一 般 用 于 临时 存放 程序 、 数 据 及 中 间 结 
果 。 而 后 者 容量 大 、 速 度 慢 ， 可 以 长 期 保存 程序 和 数据 。 输 入 设备 和 输出 设备 合 称 为 外 部 设备 
(简称 外 设 ) ， 输 入 设备 用 于 输入 原始 数据 及 各 种 命令 ， 而 输出 设备 则 用 于 输出 计算 机 运行 的 


1.1.2 中央 处 理 单元 


中 央 处 理 单元 (CPU) 是 计算 机 系统 的 核心 部 件 ， 它 负责 获取 程序 指令 、 对 指令 进行 译 码 
并 加 以 执行 。 
1. CPU 的 功能 


(1) 程序 控制 。CPU 通过 执行 指令 来 控制 程序 的 执行 顺序 ， 这 是 CPU 的 重要 功能 。 

(2) 操作 控制 。 一 条 指令 功能 的 实现 需要 若干 操作 信号 配合 来 完成 ，CPU 产生 每 条 指令 的 
操作 信号 并 将 操作 信号 送 往 对 应 的 部 件 ， 控 制 相应 的 部 件 按 指 令 的 功能 要 求 进行 操作 。 

(3) 时 间 控 制 。CPU 对 各 种 操作 进行 时 间 上 的 控制 ， 即 指令 执行 过 程 中 操作 信和 号 的 出 现时 
间 、 持 续 时间 及 出 现 的 时 间 顺 序 都 需要 进行 严格 控制 。 

(4) 数据 处 理 。CPU 通过 对 数据 进行 算术 运算 及 逻辑 运算 等 方式 进行 加 工 处 理 ， 数 据 加 工 
处 理 的 结果 被 人 们 所 利用 。 所 以 ， 对 数据 的 加 工 处 理 也 是 CPU 最 根本 的 任务 。 

此 外 ，CPU 还 需要 对 系统 内 部 和 外 部 的 中 断 ( 异 常 ) 做 出 响应 ， 进 行 相 应 的 处 理 。 
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2. CPU 的 组 成 


CPU 主要 由 运算 器 、 控 制 器 、 寄 存 器 组 和 内 部 总 线 等 部 件 组 成 ， 如 图 1-1 所 示 。 


| 


人 控制 | 


输入 /输出 接口 


| 数据 总 线 DBUS 人 


地 址 总 线 ABUS 


图 1-1 CPU 基本 组 成 结构 示意 图 


1) 运算 器 

运算 器 由 算术 逻辑 单元 (Arithmetic and Logic Unit，ALU) 、 累 加 寄存 器 、 数 据 缓冲 寄存 
器 和 状态 条 件 寄存 器 等 组 成 , 它 是 数据 加 工 处 理 部 件 , 用 于 完成 计算 机 的 各 种 算术 和 池 辑 运算 。 
相对 控制 器 而 言 ， 运 算 器 接受 控制 器 的 命令 而 进行 动作 ， 即 运算 器 所 进行 的 全 部 操作 都 是 由 控 
制 器 发 出 的 控制 信号 来 指挥 的 ， 所 以 它 是 执行 部 件 。 运 算 器 有 如 下 两 个 主要 功能 。 

(1) 执行 所 有 的 算术 运算 ， 例 如 加 、 减 、 乘 、 除 等 基本 运算 及 附加 运算 。 

(2) 执行 所 有 的 逻辑 运算 并 进行 逻辑 测试 , 例如 与 、 或 、 非 、 零 值 测试 或 两 个 值 的 比较 等 。 

下 面 简要 介绍 运算 器 中 各 组 成 部 件 的 功能 。 

(1) 算术 多 辑 单 元 (ALU)〉。ALU 是 运算 器 的 重要 组 成 部 件 ， 负 责 处 理 数据 ， 实 现 对 数 
据 的 算术 运算 和 逻辑 运算 。 

(2) 累加 寄存 器 (AC) 。AC 通常 简称 为 累加 器 ， 它 是 一 个 通用 寄存 器 ， 其 功能 是 当 运 算 
器 的 算术 逻辑 单元 执行 算术 或 逻辑 运算 时 ， 为 ALU 提供 一 个 工作 区 。 例 如 ， 在 执行 一 个 减法 
运算 前 ， 先 将 被 减 数 取出 暂 存在 AC 中 ， 再 从 内 存储 器 中 取出 减 数 ， 然 后 同 AC 的 内 容 相 减 ， 
将 所 得 的 结果 送 回 Ac 中 。 运算 的 结果 是 放 在 累加 器 中 的 , 运算 器 中 至 少 要 有 一 个 累加 寄存 器 。 
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(3) 数据 缓冲 寄存 器 (DR) 。 在 对 内 存储 器 进行 读 / 写 操作 时 ， 用 DR 暂时 存放 由 内 存储 
器 读 / 写 的 一 条 指令 或 一 个 数据 字 ， 将 不 同时 间 段 内 读 / 写 的 数据 隔离 开 来 。DR 的 主要 作用 为 : 
作为 CPU 和 内 存 、 外 部 设备 之 间 数 据 传送 的 中 转 站 ;作为 CPU 和 内 存 、 外 围 设备 之 间 在 操作 
速度 上 的 缓冲 ;在 单 累 加 器 结构 的 运算 器 中 ， 数 据 缓冲 寄存 器 还 可 兼作 为 操作 数 寄存 器 。 

(4) 状态 条 件 寄存 器 (PSW) 。PSW 保存 由 算术 指令 和 风 辑 指令 运行 或 测试 的 结果 建立 
的 各 种 条 件 码 内 容 ， 主 要 分 为 状态 标志 和 控制 标志 ， 例 如 运算 结果 进位 标志 〈C) 、 运 算 结果 
溢出 标志 (V) 、 运 算 结 果 为 0 标志 (Z) 、 运 算 结果 为 负 标志 CN) 、 中 断 标志 (I) 、 方 向 标 
志 (D) 和 单 步 标志 等 。 这 些 标志 通常 分 别 由 1 位 触发 器 保存 ， 保 存 了 当前 指令 执行 完成 之 后 
的 状态 。 通 常 ， 一 个 算术 操作 产生 一 个 运算 结果 ， 而 一 个 逻辑 操作 产生 一 个 判决 。 

2) 控制 器 

运算 器 只 能 完成 运算 ， 而 控制 器 用 于 控制 整个 CPU 的 工作 ， 它 决定 了 计算 机 运行 过 程 的 
自动 化 。 它 不 仅 要 保证 程序 的 正确 执行 ， 而 且 要 能 够 处 理 异常 事件 。 控 制 器 一 般 包 括 指令 控制 
逻辑 、 时 序 控制 逻辑 、 总 线 控制 迎 辑 和 中 断 控制 迎 辑 等 儿 个 部 分 。 

指令 控制 逻辑 要 完成 取 指 令 、 分 析 指 令 和 执行 指令 的 操作 ,其 过 程 分 为 取 指 令 、 指令 译 码 、 
按 指 令 操 作 码 执行 、 形 成 下 一 条 指令 地 址 等 步骤 。 

(1) 指令 寄存 器 (IR) 。 当 CPU 执行 一 条 指令 时 ， 先 把 它 从 内 存储 器 取 到 缓冲 寄存 器 中 ， 
再 送 入 理 暂 存 ， 指 令 译 码 器 根据 食 的 内 容 产生 各 种 微 操作 指令 ， 控 制 其 他 的 组 成 部 件 工作 ， 
完成 所 需 的 功能 。 

(2) 程序 计数 器 (PC) 。PC 具有 寄存 信息 和 计数 两 种 功能 ， 又 称 为 指令 计数 器 。 程 序 的 
执行 分 两 种 情况 ， 一 是 顺序 执行 ， 二 是 转移 执行 。 在 程序 开始 执行 前 ， 将 程序 的 起 始 地址 送 入 
了 PC， 该 地 址 在 程序 加 载 到 内 存 时 确定 ， 因 此 PC 的 内 容 即 是 程序 第 一 条 指令 的 地 址 。 执 行 指令 
时 ，CPU 自动 修改 PC 的 内 容 ， 以 便 使 其 保持 的 总 是 将 要 执行 的 下 一 条 指令 的 地 址 。 由 于 大 多 
数 指令 都 是 按 顺 序 来 执行 的 ， 所 以 修改 的 过 程 通常 只 是 简单 地 对 PC 加 1。 当 遇 到 转移 指令 时 ， 
后 继 指令 的 地 址 根据 当前 指令 的 地 址 加 上 一 个 向 前 或 向 后 转移 的 位 移 量 得 到 ， 或 者 根据 转移 指 
令 给 出 的 直接 转移 的 地 址 得 到 。 

(3) 地 址 寄存 器 〈AR) 。AR 保存 当前 CPU 所 访问 的 内 存单 元 的 地 址 。 由 于 内 存 和 CPU 
存在 着 操作 速度 上 的 差异 ， 所 以 需要 使 用 AR 保持 地 址 信息 ， 直 到 内 存 的 读 / 写 操作 完成 为 止 。 

(4) 指令 译 码 器 (ID) 。 指 令 包含 操作 码 和 地 址 码 两 部 分 ， 为 了 能 执行 任何 给 定 的 指令 ， 
必须 对 操作 码 进行 分 析 ， 以 便 识 别 所 完成 的 操作 。 指 令 译 码 器 就 是 对 指令 中 的 操作 码 字段 进行 
分 析 解 释 ， 识 别 该 指令 规定 的 操作 ， 向 操作 控制 器 发 出 具体 的 控制 信号 ， 控 制 各 部 件 工作 ， 完 
成 所 需 的 功能 。 

时 序 控制 逻辑 要 为 每 条 指令 按时 间 顺 序 提供 应 有 的 控制 信号 。 总 线 逻 辑 是 为 多 个 功能 部 件 
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服务 的 信息 通路 的 控制 电路 。 中 断 控制 逻辑 用 于 控制 各 种 中 断 请 求 ， 并 根据 优先 级 的 高 低 对 中 
断 请 求 进行 排队 ， 逐 个 交 给 CPU 处 理 。 

3) 寄存 器 组 

寄存 器 组 可 分 为 专用 寄存 器 和 通用 寄存 器 。 运 算 器 和 控制 器 中 的 寄存 器 是 专用 寄存 器 ， 其 
作用 是 固定 的 。 通 用 寄存 器 用 途 广泛 并 可 由 程序 员 规 定 其 用 途 , 其 数目 因 处 理 器 不 同 有 所 差异 。 


3. 多 核 CPU 


核心 又 称 为 内 核 ， 是 CPU 最 重要 的 组 成 部 分 。CPU 中 心 那 块 隆 起 的 芯片 就 是 核心 ， 是 由 
单 晶 硅 以 一 定 的 生产 工艺 制造 出 来 的 ，CPU 所 有 的 计算 、 接 收 /存储 命令 、 处 理 数 据 都 由 核心 
执行 。 各 种 CPU 核心 都 具有 固定 的 逻辑 结构 ， 一 级 缓存 、 二 级 缓存 、 执 行 单元 、 指 令 级 单元 和 
总 线 接口 等 逻辑 单元 都 会 有 合理 的 布局 。 

多 核 即 在 一 个 单 芯片 上 面 集成 两 个 甚至 更 多 个 处 理 器 内 核 ， 其 中 ， 每 个 内 核 都 有 自己 的 罗 
辑 单元 、 控 制 单元 、 中 断 处 理 器 、 运 算 单 元 ， 一 级 Cache、 二 级 Cache 共享 或 独 有 ， 其 部 件 的 
完整 性 和 单 核 处 理 器 内 核 相 比 完全 一 致 。 

CPU 的 主要 厂商 AMD 和 Intel 的 双核 技术 在 物理 结构 上 有 所 不 同 。 AMD 将 两 个 内 核 做 在 
一 个 Die〈 晶 元 ) 上 ， 通 过 直 连 架构 连接 起 来 ， 集 成 度 更 高 。Intel 则 是 将 放 在 不 同 核心 上 的 两 
个 内 核 封装 在 一 起 ， 因 此 将 Intel 的 方案 称 为 “ 双 芯 ”， 将 AMD 的 方案 称 为 “双核 ”。 从 用 户 
端的 角度 来 看 ，AMD 的 方案 能 够 使 双核 CPU 的 管 脚 、 功 耗 等 指标 跟 单 核 CPU 保持 一 致 ， 从 
单 核 升 级 到 双核 ， 不 需要 更 换 电 源 、 芯 片 组 、 散 热 系统 和 主板 ， 只 需要 刷新 BIOS 软件 即 可 。 

多 核 CPU 系统 最 大 的 优点 (也 是 开发 的 最 主要 目的 ) 是 可 满足 用 户 同时 进行 多 任务 处 理 
的 要 求 。 

单 核 多 线程 CPU 是 交替 地 转换 执行 多 个 任务 ， 只 不 过 交替 转换 的 时 间 很 短 ， 用 户 一 般 感 
觉 不 出 来 。 如 果 同 时 执行 的 任务 太 多 ， 就 会 感觉 到 “ 慢 ” 或 者 “ 卡 ”。 而 多 核 在 理论 上 则 是 在 
任何 时 间 内 每 个 核 执行 各 自 的 任务 ， 不 存在 交替 问题 。 因 此 ， 单 核 多 线程 和 多 核 〈 一 般 每 核 也 
是 多 线程 的 ) 虽然 都 可 以 执行 多 任务 ， 但 多 核 的 速度 更 快 。 

虽然 采用 了 Intel 超 线程 技术 的 单 核 可 以 视 为 是 双核 ，4 核 可 以 视 为 是 8 核 。 然 而 ， 视 为 是 
8 核 一 般 比 不 上 实际 是 8 核 的 CPU 性 能 。 

要 发 挥 CPU 的 多 核 性 能 , 就 需要 操作 系统 能 够 及 时 、 合理 地 给 各 个 核 分 配 任务 和 资源 (如 
缓存 、 总 线 、 内 存 等 ) ， 也 需要 应 用 软件 在 运行 时 可 以 把 并 行 的 线程 同时 交付 给 多 个 核心 分 别 
处 理 。 


1.1.3 ”数据 表示 
各 种 数值 在 计算 机 中 表示 的 形式 称 为 机 器 数 ， 其 特点 是 采用 二 进 制 计 数 制 ， 数 的 符号 用 0 
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和 1 表示 ， 小 数 点 则 隐 含 ， 表 示 不 占 位 置 。 机 器 数 对 应 的 实际 数值 称 为 数 的 真 值 。 

机 器 数 有 无 符号 数 和 带 符号 数 之 分 。 无 符号 数 表 示 正 数 ， 在 机 器 数 中 没有 符号 位 。 对 于 无 
符号 数 ， 若 约定 小 数 点 的 位 置 在 机 器 数 的 最 低位 之 后 ， 则 是 纯 整 数 ， 若 约定 小 数 点 的 位 置 在 机 
器 数 的 最 高 位 之 前 ， 则 是 纯 小 数 。 对 于 带 符号 数 ， 机 器 数 的 最 高 位 是 表示 正 、 负 的 符号 位 ， 其 
余 位 则 表示 数值 。 

为 了 便于 运算 ， 带 符号 的 机 器 数 可 采用 原 码 、 反 码 和 补 码 等 不 同 的 编码 方法 ， 机 器 数 的 这 
些 编码 方法 称 为 码 制 。 

1) 原 码 、 反 码 、 补 码 和 移 码 

(1) 原 码 表示 法 。 数 值 开 的 原 码 记 为 [并 需 ， 如 果 机 器 字 长 为 n»( 即 采用 n 个 二 进 制 位 表 


示 数 据 ) ， 则 原 码 的 定义 如 下 : 
7 一 1 
若 苑 是 纯 整数 ， 则 [YXJa= 1 人 
2 | ye 


bp 0<sX<l1 
若 工 是 纯 小 数 ， mas- 地， ee 


【 例 1.1】 若 机 器 字 长 ”等 于 8， 分 别 给 出 +1，-1，+127，--127，+45，-45，+0.5，--0.5 
的 原 码 表示 。 

[+1]m=0 0000001 [-1]#=1 0000001 

[+127 需 =0 1111111 。 [-127 顶 =1 1111111 

[+45]m=0 0101101 [-45]& =1 0101101 

[+0.5] 需 =0 91000000 [0.5]=1 91000000 (其 中 ，0 是 小 数 点 的 位 置 ) 

在 原 码 表示 法 中 ， 最 高 位 是 符号 位 ，0 表示 正 号 ，1 表示 负 号 ， 其 余 的 n-l 位 表示 数值 的 
绝对 值 。 数 值 0 的 原 码 表示 有 两 种 形式 : [+0]=0 0000000，[-0]&=1 0000000 。 

(2) 反 码 表示 法 。 数 值 耻 的 反 码 记 作 [X]& ， 如 果 机 器 字 长 为 mw， 则 反 码 的 定义 如 下 : 
省 人 
= 和 交 = < 

y 0<X<l 

若 工 是 纯 小 数 ， mene-| 0 

【 例 1.2】 若 机 器 字 长 n 等 于 8， 分 别 给 出 +1，-1，+127，-127，+45，-45，+0.5，-0.5 
的 反 码 表示 。 

[HHR=0 0000001 [HR=lL1111110 

[+127]s=0 1111111 [-127]& =1 0000000 

[+45]s =0 0101101 [-45]s=1 1010010 


车 了 是 纯 整 数 ， mas-| 


于 : 医 
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[+0.5]& =0 01000000 [-0.5]&=10 0111111 (其 中 ，9 是 小 数 点 的 位 置 ) 

在 反 码 表示 中 ， 最 高 位 是 符号 位 ，0 表示 正 号 ，1 表示 负 号 ， 正 数 的 反 码 与 原 码 相 同 ， 负 
数 的 反 码 则 是 其 绝对 值 按 位 求 反 。 数 值 0 的 反 码 表示 有 两 种 形式 : [+0]&=0 0000000， 
[-0lg=l 1111111 。 

(3) 补 码 表示 法 。 数 值 开 的 补 码 记 作 [入 ， 如 果 机 器 字 长 为 mw， 则 补 码 的 定义 如 下 : 


若 工 是 纯 整 数 ， mc | 
pi. 三 2 
OX 
车 于 是 纯 小 数 ， uC-| 2 i 
【 例 1.3】 若 机 器 字 长 n 等 于 8， 分 别 给 出 +1，-1，+127，-127，+45，-45，+0.5，-0.5 
的 补 码 表示 。 
[+1]#.=0 0000001 [=ll1111111 
[+127]=0 1111111 广 127],,=1 0000001 
[+45]%. =0 0101101 [-45]y.=1 1010011 


[+0.5]3. =0 01000000 [-0.5]¥%.=10 1000000 (其 中 ，90 是 小 数 点 的 位 置 ) 

在 补 码 表示 中 ， 最 高 位 为 符号 位 ，0 表示 正 号 ，1 表示 负 号 ， 正 数 的 补 码 与 其 原 码 和 反 码 
相同 ,负数 的 补 码 则 等 于 其 反 码 的 末 位 加 1。 在 补 码 表示 中 ,0 有 唯一 的 编码 : [+0]#, 二 0 0000000， 
[-0]x.=00000000 。 

(4) 移 码 表示 法 。 移 码 表示 法 是 在 数 卫 上 增加 一 个 偏 移 量 来 定义 的 ， 常 用 于 表示 浮 点 数 中 
的 阶 码 。 如 果 机 器 字 长 为 mw， 规定 偏 移 量 为 2” ， 则 移 码 的 定义 如 下 : 

车 了 是 纯 整 数 ， 则 [XY]g=2" + 三 (-2<XY<20);， 车工 是 纯 小 数 ， 则 [了 和 =1+ 
于 (-1< 工 <D。 

【 例 1.4】 若 机 器 字 长 ”等 于 8， 分 别 给 出 +1，-1，+127，-127，+45，-45，+0，--0 的 移 
人 码 表示 。 

[Hg=1 0000001 [Hg=0 1111111 

[+127]#=11111111  [-127]g=00000001 

[+45]g=1 0101101 [-45]g=0 1010011 

[+0]g =1 0000000 [=0]g=10000000 

实际 上 ， 在 偏 移 2” 的 情况 下 ， 只 要 将 补 码 的 符号 位 取 反 便 可 获得 相应 的 移 码 表示 。 

2) 定点 数 和 浮 点 数 

(1) 定点 数 。 所 谓 定点 数 ， 就 是 小 数 点 的 位 置 固定 不 变 的 数 。 小 数 点 的 位 置 通常 有 两 种 约 
定 方式 : 定点 整数 〈 纯 整数 ， 小 数 点 在 最 低 有 效 数值 位 之 后 ) 和 定点 小 数 〈 纯 小 数 ， 小 数 点 在 


第 1 章 计算 机 系统 知识 


最 高 有 效 数值 位 之 前 ) 。 
设 机 器 字 长 为 mw， 各 种 码 制 下 带 符号 数 的 范围 如 表 1-1 所 示 。 


表 1-1 机 器 字 长 为 n 时 各 种 码 制 表 示 的 带 符号 数 的 范围 


定点 整数 定点 小 数 


原 码 -2™ —D)~+(2™-D) (I-27)~+(1-2-0») 
反 码 | -2”-D~+C -(-2e9) 一 +(-2o9) 
补 码 -2 一 +( 2 -1) -1~+(1-2-") 


-2™~+(2™ 1) -1l~+(1-2<") 


(2) 浮 点 数 。 当 机 器 字 长 为 n 时 ， 定 点 数 的 补 码 和 移 码 可 表示 >" 个 数 ， 而 其 原 码 和 反 码 只 
能 表示 2”-1 个 数 〈0 的 表示 占用 了 两 个 编码 ， ， 因 此 ， 定 点 数 所 能 表示 的 数值 范围 比较 小 ， 在 
运算 中 很 容易 因 结 果 超 出 范围 而 溢出 。 浮 点 数 是 小 数 点 位 置 不 固定 的 数 ， 它 能 表示 更 大 范围 
的 数 。 

在 十 进 制 中 ， 一 个 数 可 以 写成 多 种 表示 形式 。 例 如 ，83.125 可 写成 1093 X 0.083125 或 
104X0.0083125 等 。 同样 ， 一 个 二 进 制 数 也 可 以 写成 多 种 表示 形式 。 例 如 ,二进制 数 1011.10101 
可 以 写成 2X0.101110101、25X0.0101110101 或 2*X0.00101110101 等 。 由 此 可 知 ， 一 个 二 进 
制 数 Y 可 以 表示 为 更 一 般 的 形式 N=25XF， 其 中 称 为 阶 码 , F 称 为 尾数 。 用 阶 码 和 尾数 表示 
的 数 称 为 浮 点 数 ， 这 种 表示 数 的 方法 称 为 浮 点 表示 法 。 

在 浮 点 表示 法 中 ， 阶 码 为 带 符号 的 纯 整 数 ， 尾 数 为 带 符号 的 纯 小 数 。 浮 点 数 的 表示 格式 


如 下 : 

很 明显 ， 一 个 数 的 浮 点 表示 不 是 唯一 的 。 当 小 数 点 的 位 置 改变 时 ， 阶 码 也 随 着 相应 改变 ， 
因此 可 以 用 多 个 浮 点 形式 表示 同一 个 数 。 

浮 点 数 所 能 表示 的 数值 范围 主要 由 阶 码 决定 ， 所 表示 数值 的 精度 则 由 尾数 决定 。 为 了 充分 
利用 尾数 来 表示 更 多 的 有 效 数 字 ， 通 常 采用 规格 化 浮 点 数 。 规 格 化 就 是 将 尾数 的 绝对 值 限定 在 
区 间 [0.5, 1]。 当 尾数 用 补 码 表 示 时 ， 需 要 注意 如 下 问题 。 

@ 若 尾 数 M>0, 则 其 规格 化 的 尾数 形式 为 ME0.1XXX…X， 其 中 ，X 可 为 0, 也 可 为 1， 
即将 尾数 限定 在 区 间 [0.5, 1]。 

@ 若 尾数 M<0， 则 其 规格 化 的 尾数 形式 为 M=1.0X xX X…X，, 其 中 ，X 可 为 0, 也 可 为 1， 
即将 尾数 M 的 范围 限定 在 区 间 广 1.-0.5]。 

如 果 浮 点 数 的 阶 码 〈 包 括 1 位 阶 符 》 用 R 位 的 移 码 表示 ， 尾 数 (包括 1 位 数 符 ) 用 M 位 
的 补 码 表示 ， 则 这 种 浮 点 数 所 能 表示 的 数值 范围 如 下 。 


国医 


到 s 大 。 软件 设计 师 教程 (第 5 版 ) 


最 大 的 正 数 ，+(L -2-x92) X 22 ”0 ， 最 小 的 负数 : -1 X 2C -9 
(3) 工业 标准 IEEE 754。 IEEE 754 是 由 IEEE 制定 的 有 关 浮 点 数 的 工业 标准 , 被 广泛 采用 。 
该 标准 的 表示 形式 如 下 : 
(-D’27 (& bb,b**b, 1 ) 
其 中 ，(-]) 为 该 浮 点 数 的 数 符 ， 当 5 为 0 时 表示 正 数 ,5 为 1 时 表示 负数 ; E 为 指数 ( 阶 码 》， 
用 移 码 表示 ; (bb,b,…b, 1 ) 为 尾数 ， 其 长 度 为 尸 位 ， 用 原 码 表示 。 
目前 ， 计 算 机 中 主要 使 用 3 种 形式 的 IEEE 754 浮 点 数 ， 如 表 1-2 所 示 。 


表 1-2 3 种 形式 的 IEEE 754 浮 点 数 格式 


参数 双 精 度 浮 点 数 扩充 精度 浮 点 数 
浮 点 数字 长 64 80 
尾数 长 度 P 52 64 
符号 位 S 1 1 
指数 长 度 E | ss 11 15 
最 大 指数 +1023 +16 383 
最 小 指数 -1022 -16382 
指数 偏 移 量 +1023 +16 383 
可 表示 的 实数 范围 0 Sm 103 td 六) 0 10*™* ap: 10% 


根据 IEEE 754 标准 , 被 编码 的 值 分 为 3 种 不 同 的 情况 : 规格 化 的 值 、 非 规格 化 的 值 和 特殊 
规格 化 的 值 为 最 普遍 的 情形 。 
@ 规格 化 的 值 。 
当 阶 码 部 分 的 二 进 制 值 不 全 为 0 也 不 全 为 1 时 ， 所 表示 的 是 规格 化 的 值 。 例 如 ， 在 单 精度 
浮 点 格式 下 ， 阶 码 为 10110011 时 ， 偏 移 量 为 +127 (01111111 ) ， 则 其 表示 的 真 值 为 
10110011-01111111=00110100， 转 换 为 十 进 制 后 为 52。 

对 于 尾数 部 分 ， 由 于 约定 小 数 点 左边 隐 含 有 一 位 ， 通 常 这 位 数 就 是 1， 因 此 单 精度 浮 点 数 
尾数 的 有 效 位 数 为 24 位 , 即 尾数 为 1.X X… Xx 。 也 就 是 说 ,不 溢出 的 情况 下 尾数 M 的 值 在 1<M<2 


之 中 ， 这 是 一 种 获得 一 个 额外 精度 位 的 表示 技巧 。 
例如 ， 单 精度 浮 点 数 格式 下 ，bob-…b,, =01001001100010001001011 时 ， 其 对 应 的 尾数 真 


但 为 12 于 2 和 2 证 2 2 的 实 汐 为 
1.28724038600921630859375〔 在 程序 中 以 十 进 制 方式 输出 时 ， 由 于 精度 的 原因 不 能 完全 给 出 此 


值 ) 。 
【 例 1.5】 利用 IEEE 754 标准 将 数 176.0625 表示 为 单 精度 浮 点 数 。 


国 
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解 : 首先 将 该 十 进 制 转换 成 二 进 制 数 。 

(176.0625),, =(10110000.0001), 

其 次 对 二 进 制 数 进行 规格 化 处 理 ，10110000.0001 二 10 01100000001X27。 这 就 保证 了 使 bo 
为 1， 而 且 小 数 点 应 当 在 9 位 置 上 。 将 bo 去 掉 并 扩展 为 单 精度 浮 点 数 所 规定 的 23 位 尾数 
01100000001000000000000。 

然后 求 阶 码 ， 上 述 表示 中 的 指数 为 7， 而 单 精度 浮 点 数 规定 指数 的 偏 移 量 为 127 注意， 
不 是 前 面 移 码 描述 中 所 提 到 的 128) ， 即 在 指数 7 上 加 127。 那 么 ，E=7+127=134， 则 指数 的 移 
人 码 表 示 为 10000110。 

最 后 ， 可 得 到 (176.0625)io 的 单 精度 浮 点 数 表示 形式 : 

0 10000110 01100000001000000000000 

@ 非 规 格 化 的 值 。 

当 阶 码 部 分 的 二 进 制 值 全 为 0 时 ， 所 表示 的 数 是 非 规格 化 的 。 在 这 种 情况 下 ， 指 数 的 真 值 
为 1- 偏 移 量 〈 对 于 单 精 度 浮 点 数 为 -126， 对 于 双 精 度 浮 点 数 为 -1022) ， 尾 数 的 值 就 是 二 进 制 
形式 对 应 的 小 数 ， 不 包含 隐 含 的 1。 

非 规格 化 数 有 两 个 用 途 : 一 是 用 来 表示 数值 0， 二 是 表示 那些 非常 接近 于 0 的 数 。 因 为 在 
规格 化 表示 方式 下 ， 必 须 使 尾数 大 于 等 于 1， 因 此 不 能 表示 出 0。 实 际 上 ，+0.0 的 浮 点 表示 是 
符号 、 阶 码 和 尾数 的 二 进 制 表 示 都 全 为 0。 需 要 注意 的 是 ， 符 号 位 为 1 而 阶 码 和 尾数 部 分 全 为 
0 时 表示 -0.0。 也 就 是 说 ，+0.0 和 -0.0 在 浮 点 表示 时 有 所 不 同 。 

@ 特殊 值 。 

当 阶 码 部 分 的 二 进 制 值 全 为 1 时 ， 表 示 特 殊 的 值 。 当 尾数 部 分 全 部 为 0 时 表示 无 穷 大 ， 当 
符号 位 为 0 时 表示 +ce， 当 符号 位 为 1 时 表示 -ce 。 当 浮 点 运算 溢出 时 ， 用 无 穷 来 表示 。 当 尾数 
部 分 不 全 为 0 时 ， 称 为 “NaN”， 即 “不 是 一 个 数 ”。 当 运算 结果 不 是 实数 或 者 无 穷 ， 就 表示 
为 NaN。 

(4) 浮 点 数 的 运算 。 设 有 浮 点 数 工 = M X2Z7，7=NX2， 求 竹 了 的 运算 过 程 要 经 过 对 阶 、 
求 尾数 和 【〈 差 ) 、 结 果 规 格 化 并 判 溢出 、 舍 入 处 理 和 溢出 判别 等 步骤 。 

@ 对 阶 。 使 两 个 数 的 阶 码 相同 。 令 故 | 世 |， 把 阶 码 小 的 数 的 尾数 右 移 天 位， 使 其 阶 码 加 
上 芷 起 < 

@ 求 尾数 和 【〔〈 差 ) 。 

@ 结果 规格 化 并 判 溢出 。 若 运算 结果 所 得 的 尾数 不 是 规格 化 的 数 ， 则 需要 进行 规格 化 处 
理 。 当 尾数 溢出 时 ， 需 要 调整 阶 码 。 

@ 舍 入 处 理 。 在 对 结果 右 规 时 ， 尾 数 的 最 低位 将 因 移 出 而 丢掉 。 另 外 ， 在 对 阶 过 程 中 也 
会 将 尾数 右 移 使 最 低位 丢掉 。 这 就 需要 进行 舍 入 处 理 ， 以 求 得 最 小 的 运算 误差 。 

@ 溢出 判别 。 以 阶 码 为 准 ， 若 阶 码 溢出 ， 则 运算 结果 溢出 ; 若 阶 码 下 溢 〈 小 于 最 小 值 ) ， 
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则 结果 为 0， 和 否则 结果 正确 ， 无 溢出 。 

浮 点 数 相 乘 ， 其 积 的 阶 码 等 于 两 乘 数 的 阶 码 相 加 ， 积 的 尾数 等 于 两 乘 数 的 尾数 相 乘 。 浮 点 
数 相 除 ， 其 商 的 阶 码 等 于 被 除数 的 阶 码 减 去 除数 的 阶 码 ， 商 的 尾数 等 于 被 除数 的 尾数 除 以 除数 
的 尾数 。 乘 除 运算 的 结果 都 需要 进行 规格 化 处 理 并 判断 阶 码 是 否 溢出 。 


1.1.4 ” 校 验 码 


计算 机 系统 运行 时 ， 为 了 确保 数据 在 传送 过 程 中 正确 无 误 ， 一 是 提高 硬件 电路 的 可 靠 性 ， 
二 是 提高 代码 的 校 验 能 力 ， 包 括 查 错 和 纠 错 。 通 常 使 用 校 验 码 的 方法 来 检测 传送 的 数据 是 否 出 
错 。 其 基本 思想 是 把 数据 可 能 出 现 的 编码 分 为 两 类 : 合法 编码 和 错误 编码 。 合 法 编码 用 于 传送 
数据 ， 错 误 编码 是 不 允许 在 数据 中 出 现 的 编码 。 合 理 地 设计 错误 编码 以 及 编码 规则 ， 使 得 数据 
在 传送 中 出 现 某 种 错误 时 会 变 成 错误 编码 ， 这 样 就 可 以 检测 出 接收 到 的 数据 是 否 有 错 。 

所 谓 码 距 , 是 指 一 个 编码 系统 中 任意 两 个 合法 编码 之 间 至 少 有 多 少 个 二 进 制 位 不 同 。 例如， 
4 位 8421 码 的 码 距 为 1， 在 传输 过 程 中 ， 该 代码 的 一 位 或 多 位 发 生 错误 ， 都 将 变 成 另外 一 个 合 
法 的 编码 ， 因 此 这 种 代码 无 检 错 能 力 。 下 面 简要 介绍 常用 的 3 种 校 验 码 : 奇偶 校 验 码 、 海 明码 
和 循环 元 余 校 验 码 。 


1. 奇偶 校 验 码 


奇偶 校 验 (Parity Codes) 是 一 种 简单 有 效 的 校 验方 法 。 这 种 方法 通过 在 编码 中 增加 一 位 
校 验 位 来 使 编码 中 1 的 个 数 为 奇数 〈 奇 校 验 ) 或 者 为 偶数 〈 偶 校 验 ) ， 从 而 使 码 距 变 为 2。 对 
于 奇 校 验 ， 它 可 以 检测 代码 中 奇数 位 出 错 的 编码 ， 但 不 能 发 现 偶数 位 出 错 的 情况 ， 即 当 合法 编 
码 中 的 奇数 位 发 生 了 错误 时 ， 即 编码 中 的 1 变 成 0 或 0 变 成 1， 则 该 编码 中 1 的 个 数 的 奇偶 性 
就 发 生 了 变化 ， 从 而 可 以 发 现 错误 。 

常用 的 奇偶 校 验 码 有 3 种 : 水 平 奇偶 校 验 码 、 垂 直 奇偶 校 验 码 和 水 平 垂直 校 验 码 。 

2.， 海 明码 


海 明 码 (Hamming Code) 是 由 贝尔 实验 室 的 Richard Hamming 设计 的 ， 是 一 种 利用 奇偶 
性 来 检 错 和 纠 错 的 校 验方 法 。 海 明码 的 构成 方法 是 在 数据 位 之 间 的 特定 位 置 上 插入 大 个 校 验 
位 ， 通 过 扩大 码 距 来 实现 检 错 和 纠 错 。 

设 数据 位 是 位 ， 校 验 位 是 天 位 ， 则 ”和 大 必须 满足 以 下 关系 : 

站 一 1>m+ 大 

海 明 码 的 编码 规则 如 下 。 

设 个 校 验 位 为 PaPes Ps 雹 个 数据 位 为 D1,D, ;2,*…* ,D1,Do, 对 应 的 海 明 码 为 
HH …H， 那 么 : 
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(1) Pi 在 海 明 码 的 第 2 站 位 置 ， 即 HF-P;， 且 广 2 一 ， 数 据 位 则 依 序 从 低 到 高 占据 海 明 码 中 
剩 下 的 位 置 。 

(2) 海 明 码 中 的 任何 一 位 都 是 由 若干 个 校 验 位 来 校 验 的 。 其 对 应 关系 如 下 : 被 校 验 的 海 明 
位 的 下 标 等 于 所 有 参与 校 验 该 位 的 校 验 位 的 下 标 之 和 ， 而 校 验 位 由 自身 校 验 。 

对 于 8 位 的 数据 位 ， 进 行 海 明 校 验 需要 4 个 校 验 位 (21=7, 2 二 1=15>8+4) 。 令 数据 位 为 
Dy,De,Ds,Da,D;3,D;,D1,Do, 校 验 位 为 Pa,P3,P,P1， 形 成 的 海 明 码 为 Hz, Hi…,H3,Hz,H， 则 编码 过 
程 如 下 。 

(1) 确定 DD 与 P 在 海 明 码 中 的 位 置 ， 如 下 所 示 : 

Hs Hn Ho Ho Hs H He Hs H Hi 了 于 H 
D, De Di D: P: D; D, DBP D P, P 
(2) 确定 校 验 关系 ， 如 表 1-3 所 示 。 


表 1-3 海 明 码 的 校 验 关系 表 


海 明 码 海 明 码 的 下 标 | 校 验 位 组 说 明 《〈 介 校 验 ) 
my I | 
H, (P;) 2 ti te 
Hh Dy 5 pepepepen 
mh | Em 各 

即 P=Do@D@D;@D;@D6 
mo | cos | em | 

= 1+2+ 

ee 他 P3 校 验 : P3、D1、D,、D;3、Dy 
Hs (P4) 8 即 P=Di@gD;@D;@D， 
mo | sa aa 
Hio(D5) 10=2+8 Ps 校 验 : Ps、Ds、 Ds、Ds、 D7 
Hu (De) 11=1+2+8 即 P=Ds@ D;@® De@ Dy 


若 采 用 奇 校 验 ， 则 将 各 校 验 位 的 偶 校 验 值 取 反 即 可 。 

(3) 检测 错误 。 对 使 用 海 明 编码 的 数据 进行 差错 检测 很 简单 ， 只 需 做 以 下 计算 : 
G1=P.@D.®@ DI®@D;@®@Di@®@Dse 

G;=P;® Do.@ D,®D;@D;@Ds 

G;=P3® Di@D,®@D;@D; 

G41=P1®@ D1®@ D;®@ De@D; 

若 采 用 偶 校 验 ， 则 G4G3GzG 全 为 0 时 表示 接收 到 的 数据 无 错误 〈 奇 校 验 应 全 为 1 ) 。 当 
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G4G3G2G1 不 全 为 0 时 说 明 发 生 了 差错 ， 而 且 G4G3G?Gi 的 十 进 制 值 指出 了 发 生 错误 的 位 置 ， 例 
如 GsG3G;G1=1010， 说 明 Hio(D;) 出 错 了 ， 将 其 取 反 即 可 纠正 错误 。 
【 例 1.6】 设 数据 为 01101001， 试 采用 4 个 校 验 位 求 其 偶 校 验方 式 的 海 明 码 。 
解 : DiDeD;DsD;D;DiDo=01101001， 根 据 公 式 
Pi=Do@D@D;@DI,@D=19609190@91=1 
P,=Do®@D,®@ Di@D;@Dec=1®80@81@81981=0 
P=DI®@D,@D®@D,=0®80@8180=1 
P=D@D;@De@D,=0081®@81®80=0 
求 得 的 海 明 码 为 : 
H2 HI Ho Ho Hs H He H: H HH HH, 下 
BD 
1 i 


3. 循环 匈 余 校 验 码 


循环 元 余 校 验 码 (Cyclic Redundancy Check，CRC) 广泛 应 用 于 数据 通信 领域 和 磁 介 质 
存储 系统 中 。 它 利用 生成 多 项 式 为 个 数据 位 产生 7 个 校 验 位 来 进行 编码 ， 其 编码 长 度 为 ktr。 
CRC 的 代码 格式 为 : 


n Ln! rtl rl 2 1 


Ek 数据 位 十 校 验 位 ] 


由 此 可 知 ， 循 环 兄 余 校 验 码 是 由 两 部 分 组 成 的 ， 左 边 为 信息 码 〈 数 据 ) ， 右 边 为 校 验 码 。 
若 信 息 码 占 大 位 ， 则 校 验 码 就 占 mx 大 位 。 其 中 ,7 为 CRC 码 的 字 长 ， 所 以 又 称 为 (mn， 大 ) 码 。 
校 验 码 是 由 信息 码 产 生 的 ， 校 验 码 位 数 越 多 ， 该 代码 的 校 验 能 力 就 越 强 。 在 求 CRC 编码 时 ， 
采用 的 是 模 2 运算 。 模 2 加 减 运算 的 规则 是 按 位 运算 ， 不 发 生 借 位 和 进位 。 


1.2 计算 机 体系 结构 


1.2.1 计算 机 体系 结构 的 发 展 


1. 计算 机 系统 结构 概述 
1964 年 ， 阿 姆 达尔 (GM.Amdahl) 在 介绍 IBM360 系统 时 指出 : 计算 机 体系 结构 是 站 在 
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程序 员 的 角度 所 看 到 的 计算 机 属性 ， 即 程序 员 要 能 编写 出 可 在 机 器 上 正确 运行 的 程序 所 必须 了 
解 的 概念 性 结构 和 功能 特性 。 

1982 年 , 梅 尔 斯 (GJMyers ) 在 其 所 著 的 《计算 机 体系 结构 的 进展 》(Advances in Computer 
Architecture) 一 书 中 定义 了 组 成 计算 机 系统 的 若干 层次 ， 每 一 层 都 提供 一 定 的 功能 支持 它 上 面 
的 一 层 ， 并 把 不 同 层 之 间 的 界面 定义 为 某 种 类 型 的 体系 结构 。Myers 的 定义 发 展 了 Amdahl 的 概念 
性 结构 思想 ， 明 确 了 传统 体系 结构 就 是 指 硬件 与 软件 之 间 的 界面 ， 即 指令 集体 系 结构 。 

1984 年 ， 拜 尔 (JL.Baer) 在 一 篇 题 为 “计算 机 体系 结构 (Computer Architecture) ”的 文 
章 中 给 出 了 一 个 含义 更 加 广泛 的 定义 : 体系 结构 由 结构 、 组 织 、 实现、 性 能 4 个 基本 方面 组 成 。 
其 中 ， 结 构 指 计算 机 系统 各 种 硬件 的 互 连 ， 组 织 指 各 种 部 件 的 动态 联系 与 管理 ， 实 现 指 各 模块 
设计 的 组 装 完成 ， 性 能 指 计算 机 系统 的 行为 表现 。 这 个 定义 发 展 了 Amdahl 的 功能 特性 思想 。 显 
然 ， 这 里 的 计算 机 系统 组 织 又 成 为 体系 结构 的 一 个 子 集 。 

计算 机 体系 结构 、 计 算 机 组 织 和 计算 机 实现 三 者 的 关系 如 下 。 

(1) 计算 机 体系 结构 (Computer Architecture) 是 指 计算 机 的 概念 性 结构 和 功能 属性 。 

(2) 计算 机 组 织 (Computer Organization) 是 指 计算 机 体系 结构 的 逻辑 实现 ， 包括 机 器 内 的 
数据 流 和 控制 流 的 组 成 以 及 逻辑 设计 等 〈 常 称 为 计算 机 组 成 原理 ) 。 

(3) 计算 机 实现 〈Compnuter Implementation) 是 指 计算 机 组 织 的 物理 实现 。 


2. 计算 机 体系 结构 分 类 


(1) 从 宏观 上 按 处 理 机 的 数量 进行 分 类 ， 分 为 单 处 理 系统 、 并 行 处 理 与 多 处 理 系统 和 分 布 
式 处 理 系统 。 
e 单 处 理 系统 (Uni-processing System) 。 利 用 一 个 处 理 单元 与 其 他 外 部 设备 结合 起 来 ， 
实现 存储 、 计 算 、 通 信 、 输 入 与 输出 等 功能 的 系统 。 
e 并行 处 理 与 多 处 理 系 统 (Parallel Processing and Multiprocessing System ) 。 为 了 充分 发 
挥 问题 求解 过 程 中 处 理 的 并 行 性 , 将 两 个 以 上 的 处 理 机 互 连 起 来 , 彼此 进行 通信 协调 ， 
以 便 共 同 求解 一 个 大 问题 的 计算 机 系统 。 
e 分布 式 处 理 系 统 (Distributed Processing System) 。 指 物理 上 远 距 离 而 松 耦 合 的 多 计算 
机 系统 。 其 中 ， 物 理 上 的 远 距 离 意 味 着 通信 时 间 与 处 理 时 间 相 比 已 不 可 忽略 ， 在 通信 
线路 上 的 数据 传输 速率 要 比 在 处 理 机 内 部 总 线 上 传输 慢 得 多 , 这 也 正 是 松 耦 合 的 含义 。 
(2) 从 微观 上 按 并 行程 度 分 类 ， 有 Flynn 分 类 法 、 汉 泽 云 分 类 法 、Handler 分 类 法 和 Kuck 
分 类 法 。 
e ”Flynn 分 类 法 。1966 年 ，M.JFlynn 提出 按 指 令 流 和 数据 流 的 多 少 进行 分 类 。 指 令 流 为 
机 器 执行 的 指令 序列 ， 数 据 流 是 由 指令 调用 的 数据 序列 。Flynn 把 计算 机 系统 的 结构 
分 为 单 指令 流 、 单 数据 流 〈Single Instruction stream Single Data stream，SISD) ， 单 指 
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令 流 、 多 数据 流 (Single Instruction stream Multiple Data stream，SIMD) ， 多 指令 流 、 
单数 据 流 (Multiple Instruction stream Single Data stream，MISD) 和 多 指令 流 、 多 数据 
流 (Multiple Instruction stream Multiple Data steam，MIMD) 4 类 。 

。 ” 冯 泽 云 分 类 法 。1972 年 ， 美 籍 华人 冯 泽 云 (Tse-yun Feng) 提出 按 并 行 度 对 各 种 计算 
机 系统 进行 结构 分 类 。 所 谓 最 大 并 行 度 Pm 是 指 计算 机 系统 在 单位 时 间 内 能 够 处 理 的 
最 大 二 进 制 位 数 。 冯 泽 云 把 计算 机 系统 分 成 字 串 行 位 串 行 (WSBS) 计算 机 、 字 并 行 
位 串 行 (WPBS) 计算 机 、 字 串 行 位 并 行 (WSBP) 计算 机 和 字 并 行 位 并 行 (WPBP) 
计算 机 4 类 。 

e Handler 分 类 法 。1977 年 ， 德 国 的 汉 德 勒 (Wolfgang Handler) 提出 一 个 基于 硬件 并 行 
程度 计算 并 行 度 的 方法 ， 把 计算 机 的 硬件 结构 分 为 3 个 层次 : 处理 机 级 、 每 个 处 理 机 

中 的 算 罗 单元 级 、 每 个 算 罗 单元 中 的 逻辑 门 电路 级 。 分 别 计算 这 三 级 中 可 以 并 行 或 流 
水 处 理 的 程序 ， 即 可 算出 某 系 统 的 并 行 度 。 

e ”Kuck 分 类 法 。1978 年 , 美国 的 库 克 (David JKuck) 提出 与 Flynn 分 类 法 类 似 的 方法 ， 
用 指令 流 和 执行 流 (Execution Stream) 及 其 多 重 性 来 描述 计算 机 系统 控制 结构 的 特征 。 
Kuck 把 系统 结构 分 为 单 指令 流 单 执行 流 (SISE) 、 单 指令 流 多 执行 流 (SIME) 、 多 
指令 流 单 执行 流 (MISE) 和 多 指令 流 多 执行 流 (MIME) 4 类 。 


3， 指令 系统 


一 个 处 理 器 支持 的 指令 和 指令 的 字 节 级 编码 称 为 其 指令 集体 系 结构 (Instruction Set 
Architecture，ISA) ， 不 同 的 处 理 器 族 支持 不 同 的 指令 集体 系 结构 ， 因 此 ， 一 个 程序 被 编译 在 
一 种 机 器 上 运行 ， 往 往 不 能 在 另 一 种 机 器 上 运行 。 

1) 指令 集体 系 结构 的 分 类 

从 体系 结构 的 观点 对 指令 集 进行 分 类 ， 可 以 根据 下 述 5 个 方面 。 

(1) 操作 数 在 CPU 中 的 存储 方式 ， 即 操作 数 从 主 存 中 取出 后 保存 在 什么 地 方 。 

(2) 显 式 操作 数 的 数量 ， 即 在 典型 的 指令 中 有 多 少 个 显 式 命名 的 操作 数 。 

(3) 操作 数 的 位 置 ， 即 任 一 个 ALU 指令 的 操作 数 能 否 放 在 主 丰 中， 如何 定位 。 

(4) 指令 的 操作 ， 即 在 指令 集中 提供 哪些 操作 。 

(5) 操作 数 的 类 型 与 大 小 。 

按 暂 存 机 制 分 类 ， 根 据 在 CPU 内 部 存储 操作 数 的 区 别 ， 可 以 把 指令 集体 系 分 为 3 类 : 堆 
栈 (Stack) 、 累 加 器 (Accumulator) 和 寄存 器 组 (a set of Registers) 。 

通用 寄存 器 (General-Purpose Register Machines，GPR) 的 关键 性 优点 是 编译 程序 能 有 效 
地 使 用 寄存 器 ， 无 论 是 计算 表达 式 的 值 ， 还 是 从 全 局 的 角度 使 用 寄存 器 来 保存 变量 的 值 。 在 求 
解 表 达 式 时 ， 寄 存 器 比 堆栈 或 者 累加 器 能 提供 更 加 灵活 的 次 序 。 更 重要 的 是 ， 寄 存 器 能 用 来 保 
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存 变 量 。 当 变量 分 配给 寄存 器 时 ， 访 存 流 量 (Memory Traffic) 就 会 减少 ， 程 序 运 行 就 会 加 速 ， 
而 且 代码 密度 也 会 得 到 改善 。 用 户 可 以 用 指令 集 的 两 个 主要 特征 来 区 分 GPR 体系 结构 。 第 一 个 
是 ALU 指令 有 两 个 或 3 个 操作 数 。 在 三 操作 数 格式 中 ， 指 令 包 括 两 个 源 操作 数 和 一 个 目的 操 
作 数 ， 在 二 操作 数 格式 中 ， 有 一 个 操作 数 既 是 源 操作 数 又 是 目的 操作 数 。 第 二 个 是 ALU 指令 
中 有 几 个 操作 数 是 存储 器 地 址 ， 对 于 典型 的 ALU 指令 ， 这 个 数 可 能 在 1 一 3 之 间 。 

2) CISC 和 RISC 

CISC 和 RISC 是 指令 集 发 展 的 两 种 途径 。 

(1) CISC (Complex Instruction Set Computer， 复 杂 指 令 集 计 算 机 ) 的 基本 思想 是 进一步 增 
强 原 有 指令 的 功能 ， 用 更 为 复杂 的 新 指令 取代 原先 由 软件 子 程序 完成 的 功能 ， 实 现 软件 功能 的 
硬化 , 导致 机 器 的 指令 系统 越 来 越 庞 大 、 复杂 。 事 实 上 , 目前 使 用 的 绝 大 多 数 计算 机 都 属于 CISC 
类 型 。 

CISC 的 主要 次 端 如 下 。 

@ 指令 集 过 分 庞杂 。 

@ 微 程序 技术 是 CISC 的 重要 支柱 , 每 条 复杂 指令 都 要 通过 执行 一 段 解释 性 微 程序 才能 完 
成 ， 这 就 需要 多 个 CPU 周期 ， 从 而 降低 了 机 器 的 处 理 速度 。 

@ 由 于 指令 系统 过 分 庞大 ， 使 高 级 语言 编译 程序 选择 目标 指令 的 范围 很 大 ， 并 使 编译 程 
序 本 身 宛 长 、 复 杂 ， 从 而 难以 优化 编译 使 之 生成 真正 高 效 的 目标 代码 。 

@ CISC 强调 完善 的 中 断 控制 ， 势 必 导致 动作 繁多 、 设 计 复杂 、 研 制 周期 长 。 

@ CISC 给 芯片 设计 带 来 很 多 困难 ， 使 芯片 种 类 增多 ， 出 错 几 率 增 大 ， 成 本 提高 而 成 品 率 
降低 。 

(2) RISC (Reduced Instruction Set Computer， 精 简 指 令 集 计算 机 ) 的 基本 思想 是 通过 减少 
指令 总 数 和 简化 指令 功能 降低 硬件 设计 的 复杂 度 ， 使 指令 能 单 周 期 执行 ， 并 通过 优化 编译 提高 
指令 的 执行 速度 ， 采 用 硬 布 线 控制 逻辑 优化 编译 程序 。RISC 在 20 世纪 70 年 代 末 开始 兴起 ， 
导致 机 器 的 指令 系统 进一步 精炼 而 简单 。 

RISC 的 关键 技术 如 下 。 

Q@ 重 受 寄存 器 窗口 技术 。 在 伯克利 的 RISC 项 目 中 首先 采用 了 重 倒 寄存 器 窗口 
(Overlapping Register Windows) 技术 。 其 基本 思想 是 在 处 理 机 中 设置 一 个 数量 比较 大 的 寄存 器 
堆 ， 并 把 它 划分 成 很 多 个 窗口 。 每 个 过 程 使 用 其 中 相 邻 的 3 个 窗口 和 一 个 公共 的 窗口 ， 而 在 这 
些 窗口 中 有 一 个 窗口 是 与 前 一 个 过 程 共用 ， 还 有 一 个 窗口 是 与 下 一 个 过 程 共用 的 。 与 前 一 过 程 
共用 的 窗口 可 以 用 来 存放 前 一 过 程 传送 给 本 过 程 的 参数 ， 同 时 也 存放 本 过 程 传送 给 前 一 过 程 的 
计算 结果 。 同 样 ， 与 下 一 过 程 共用 窗口 可 以 用 来 存放 本 过 程 传送 给 下 一 过 程 的 参数 和 存放 下 一 
过 程 传送 给 本 过 程 的 计算 结果 。 


加 :: 医 
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@ 优化 编译 技术 。RISC 使 用 了 大 量 的 寄存 器 ， 如 何 合理 地 分 配 寄存 器 、 提 高 寄存 器 的 使 
用 效率 及 减少 访 存 次 数 等 ， 都 应 通过 编译 技术 的 优化 来 实现 。 

图 超 流 水 及 超标 量 技术 。 为 了 进一步 提高 流水 线 速度 而 采用 的 技术 。 

@ 硬 布线 逻辑 与 微 程序 相 结合 在 微 程序 技术 中 。 

(3) 优化 。 

为 了 提高 目标 程序 的 实现 效率 ， 人 们 对 大 量 的 机 器 语言 目标 代码 及 其 执行 情况 进行 了 统 
计 。 对 程序 中 出 现 的 各 种 指令 以 及 指令 串 进 行 统计 得 到 的 百分比 称 为 静态 使 用 频 度 。 在 程序 执 
行 过 程 中 ， 对 出 现 的 各 种 指令 以 及 指令 串 进 行 统计 得 到 的 百分比 称 为 动态 使 用 频 度 。 按 静态 使 
用 频 度 来 改进 目标 代码 可 减少 目标 程序 所 占 的 存储 空间 ， 按 动态 使 用 频 度 来 改进 目标 代码 可 减 
少 目标 程序 运行 的 执行 时 间 。 大 量 统计 表明 ， 动 态 和 静态 使 用 频 度 两 者 非常 接近 ， 最 常用 的 指 
令 是 存 、 取 、 条 件 转移 等 。 对 它们 加 以 优化 ， 既 可 以 减少 程序 所 需 的 存储 空间 ， 又 可 以 提高 程 
序 的 执行 速度 。 

面向 高 级 程序 语言 的 优化 思路 是 尽 可 能 缩小 高 级 语言 与 机 器 语言 之 间 的 语义 差距 ， 以 利于 
支持 高 级 语言 编译 系统 ， 缩 短 编译 程序 的 长 度 和 编译 所 需 的 时 间 。 

面向 操作 的 优化 思路 是 进一步 缩小 操作 系统 与 体系 结构 之 间 的 语义 差距 ， 以 利于 减少 
操作 系统 运行 所 需 的 辅助 时 间 ， 节 省 操作 系统 软件 所 占用 的 存储 空间 。 操 作 系统 的 实现 依赖 于 
体系 结构 对 它 的 支持 。 许 多 传统 机 器 指令 ,例如 算术 风 辑 指令 、 字 符 编辑 指令 、 移 位 指令 和 控 
制 转移 指令 等 ， 都 可 用 于 操作 系统 的 实现 。 此 外 ， 还 有 相当 一 部 分 指令 是 专门 为 实现 操作 系统 
的 各 种 功能 而 设计 的 。 

3) 指令 的 流水 处 理 

(1) 指令 控制 方式 。 指 令 控制 方式 有 顺序 方式 、 重 县 方式 和 流水 方式 3 种 。 

@ 顺序 方式 。 顺 序 方式 是 指 各 条 机 器 指令 之 间 顺 序 串 行 地 执行 ， 执 行 完 一 条 指令 后 才 取 
下 一 条 指令 ， 而 且 每 条 机 器 指令 内 部 的 各 个 微 操作 也 是 顺序 串 行 地 执行 。 这 种 方式 的 优点 是 控 
制 简单 。 缺 点 是 速度 慢 ， 机 器 各 部 件 的 利用 率 低 。 

@ 重 过 方式。 重 受 方式 是 指 在 解释 第 玉 条 指令 的 操作 完成 之 前 就 可 以 开始 解释 第 K+1l 条 
指令 ， 如 图 1-2 所 示 。 通 常 采用 的 是 一 次 重 又 ， 即 在 任何 时 候 ， 指 令 分 析 部 件 和 指令 执行 部 件 
都 只 有 相 邻 两 条 指令 在 重 琶 解释 。 这 种 方式 的 优点 是 速度 有 所 提高 ， 控 制 也 不 太 复 杂 。 缺 点 是 
会 出 现 冲 突 、 转 移 和 相关 等 问题 ， 在 设计 时 必须 想 办 法 解决 。 


分 析 指令 天 执行 指令 天 


分 析 指令 K+1 执行 指令 K+1 


图 1-2 一 次 重 秋 处理 
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@ 流水 方式 。 流 水 方式 是 模仿 工业 生产 过 程 的 流水 线 〈 如 汽车 装配 线 ) 而 提出 的 一 种 指 
令 控 制 方式 。 流 水 〈Pipelining) 技术 是 把 并 行 性 或 并 发 性 嵌入 到 计算 机 系统 里 的 一 种 形式 ， 它 
把 重复 的 顺序 处 理 过 程 分 解 为 若干 子 过 程 ， 每 个 子 过 程 能 在 专用 的 独立 模块 上 有 效 地 并 发 工 
作 ， 如 图 1-3 所 示 。 


图 1-3 流水 处 理 的 时 空 图 


在 概念 上 ，“ 流 水 ”可 以 看 成 是 “重合” 的 延伸 。 差 别 仅 在 于 “一 次 重合 ”是 把 一 条 指令 
解释 分 解 为 两 个 子 过 程 ， 而 “流水 ” 则 是 分 解 为 更 多 的 子 过 程 。 

(2) 流水 线 的 种 类 。 

@ 从 流水 的 级 别 上 ， 可 分 为 部 件 级 、 处 理 机 级 以 及 系统 级 的 流水 。 

@ 从 流水 的 功能 上 ， 可 分 为 单 功能 流水 线 和 多 功能 流水 线 。 

@ 从 流水 的 连接 上 ， 可 分 为 静态 流水 线 和 动态 流水 线 。 

@ 从 流水 是 否 有 反馈 回路 ， 可 分 为 线性 流水 线 和 非 线性 流水 线 。 

@ 从 流水 的 流动 顺序 上 ， 可 分 为 同步 流水 线 和 异步 流水 线 。 

@ 从 流水 线 的 数据 表示 上 ， 可 分 为 标量 流水 线 和 向 量 流水 线 。 

(3) 流水 的 相关 处 理 。 

由 于 流水 时 机 器 同时 解释 多 条 指令 ， 这 些 指令 可 能 有 对 同一 主 存 单元 或 同一 寄存 器 的 “ 先 
写 后 读 ” 的 要 求 ， 这 时 就 出 现 了 相关 。 这 种 相关 包括 指令 相关 、 访 存 操作 数 相关 以 及 通用 寄存 
器 组 相关 等 ， 它 只 影响 相关 的 两 条 或 儿 条 指令 ， 而 且 最 多 影响 流水 线 的 某 些 段 推 后 工作 ， 并 不 
会 改动 指令 缓冲 器 中 预 取 到 的 指令 内 容 ， 影 响 是 局 部 的 ， 所 以 称 为 局 部 性 相关 。 解 决 局 部 性 相 
关 有 两 种 方法 : 推 后 法 和 通路 法 。 推 后 法 是 推 后 对 相关 单元 的 读 ， 直 至 写 入 完成 。 通 路 法 设置 
相关 专用 通路 ， 使 得 不 必 先 把 运算 结果 写 入 相关 存储 单元 ， 再 从 这 里 读 出 后 才能 使 用 ， 而 是 经 
过 相关 专用 通路 直接 使 用 运算 结果 ， 以 加 快速 度 。 


国 18 荐 。 软 作 设 计 师 教程 (第 5 版) 


转移 指令 〈 尤 其 是 条 件 转移 指令 ) 与 它 后 面 的 指令 之 间 存 在 关联 ， 使 之 不 能 同时 解释 。 执 
行 转移 指令 时 ， 可 能 会 改动 指令 缓冲 器 中 预 取 到 的 指令 内 容 ， 从 而 会 造成 流水 线 知 吐 率 和 效率 
下 降 ， 比 局 部 性 相关 的 影响 要 严重 得 多 ， 所 以 称 为 全 局 性 相关 。 

解决 全 局 性 相关 有 3 种 方法 : 猜测 转移 分 支 、 加 快 和 提前 形成 条 件 码 、 加 快 短 循环 程序 的 
处 理 。 

条 件 转移 指令 有 两 个 分 支 , 一 个 分 支 是 按 原 来 的 顺序 继续 执行 下 去 , 称 为 转移 不 成 功 分 支 ; 
另 一 个 分 支 是 按 转移 后 的 新 指令 序列 执行 ， 称 为 转移 成 功 分 支 。 许 多 流水 机 器 都 猜 选 转移 不 成 
功 分 支 ， 若 猜 对 的 几率 很 大 ， 流 水 线 的 吞吐 率 和 效率 就 会 比 不 采用 猜测 法 时 高 得 多 。 

尽早 获得 条 件 码 以 便 对 流水 线 简化 条 件 转移 的 处 理 。 例 如 , 一 个 乘法 运算 所 需 的 时 间 较 长 ， 
但 在 运算 之 前 就 能 知道 其 结果 为 正 或 为 负 ， 或 者 是 否 为 0， 因 此 ， 加 快 单条 指令 内 部 条 件 码 的 
形成 ， 或 者 在 一 段 程序 内 提前 形成 条 件 码 ， 对 转移 问题 的 顺利 解决 是 很 有 好 处 的 。 

由 于 程序 中 广泛 采用 循环 结构 ， 因 此 流水 线 大 多 采用 特殊 措施 以 加 快 循环 程序 的 处 理 。 例 
如 ， 使 整个 循环 程序 都 放 入 指令 缓冲 存储 器 中 ， 对 提高 流水 效率 和 吞吐 率 均 有 明显 效果 。 中 断 
和 转移 一 样 ， 也 会 引起 流水 线 断 流 。 好 在 中 断 出现 的 概率 要 比 条 件 转移 出 现 的 概率 低 得 多 ， 因 
此 只 要 处 理 好 断 点 现场 保护 及 中 断后 的 恢复 ， 尽 量 缩短 断 流 时 间 即 可 。 

RISC 中 采用 的 流水 技术 有 3 种 : 超 流 水 线 、 超 标量 以 及 超 长 指令 字 。 

@ 超 流水 线 (Super Pipe Line) 技术 。 它 通过 细 化 流水 、 增 加 级 数 和 提高 主 频 ， 使 得 在 每 
个 机 器 周期 内 能 完成 一 个 甚至 两 个 浮 点 操作 。 其 实质 是 以 时 间 换取 空间 。 超 流水 机 器 的 特征 是 
在 所 有 的 功能 单元 都 采用 流水 ， 并 有 更 高 的 时 钟 频率 和 更 深 的 流水 深度 。 由 于 它 只 限于 指令 级 
的 并 行 ， 所 以 超 流 水 机 器 的 CPI (Clock Cycles Per Instruction， 每 个 指令 需要 的 机 器 周期 数 ) 值 
稍 高 。 

@ 超标 量 (Super Scalar) 技术 。 它 通过 内 装 多 条 流水 线 来 同时 执行 多 个 处 理 ， 其 时 钟 频 
率 虽然 与 一 般 流水 接近 ， 却 有 更 小 的 CPI。 其 实质 是 以 空间 换取 时 间 。 

图 超 长 指令 字 (Very Long Instruction Word，VLIW) 技术 。VLIW 和 超标 量 都 是 20 世纪 
80 年 代 出 现 的 概念 ， 其 共同 点 是 要 同时 执行 多 条 指令 ,其 不 同 在 于 超标 量 依 靠 硬 件 来 实现 并 行 
处 理 的 调度 ，VLIW 则 充分 发 挥 软件 的 作用 ， 而 使 硬件 简化 ， 性 能 提高 。VLIW 有 更 小 的 CPI 
值 ， 但 需要 有 足够 高 的 时 钟 频 率 。 

(4) 奉 吐 率 和 流水 建立 时 间 。 

吞吐 率 是 指 单位 时 间 内 流水 线 处 理 机 流出 的 结果 数 。 对 指令 而 言 ， 就 是 单位 时 间 内 执行 的 
指令 数 。 如 果 流 水 线 的 子 过程 所 用 时 间 不 一 样 ， 则 雁 吐 率 p 应 为 最 长 子 过 程 的 倒数 ， 即 

p=1/max{Ah,At,,*, Atn} 


流水 线 开始 工作 ， 需 经 过 一 定时 间 才 能 达到 最 大 吞吐 率 ， 这 就 是 建立 时 间 。 若 m 个 子 过 程 
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所 用 时 间 一 样 ， 均 为 An ， 则 建立 时 间 马 =mAn 。 
4. 阵列 处 理 机 、 并 行 处 理 机 和 多 处 理 机 


并 行 性 包括 同时 性 和 并 发 性 。 其 中 ， 同 时 性 是 指 两 个 或 两 个 以 上 的 事件 在 同一 时 刻 发 生 ， 
并 发 性 是 指 两 个 或 两 个 以 上 的 事件 在 同一 时 间 间 隔 内 连续 发 生 。 

从 计算 机 信息 处 理 的 步骤 和 阶段 的 角度 看 ， 并 行 处 理 可 分 为 如 下 几 类 。 

(1) 存储 器 操作 并 行 。 

(2) 处 理 器 操作 步骤 并 行 〈 流 水 线 处 理 机 ) 。 

(3) 处 理 器 操作 并 行 〈 阵 列 处 理 机 ) 。 

(4) 指令 、 任 务 、 作 业 并 行 〈 多 处 理 机 、 分 布 处 理 系 统 、 计 算 机 网 络 ) 。 

1) 阵列 处 理 机 

阵列 处 理 机 将 重复 设置 的 多 个 处 理 单元 (PU ) 按 一 定 方式 连 成 阵列 , 在 单个 控制 部 件 (CU) 
控制 下 ， 对 分 配给 自己 的 数据 进行 处 理 ， 并 行 地 完成 一 条 指令 所 规定 的 操作 。 这 是 一 种 单 指令 
流 多 数据 流 计 算 机 ， 通 过 资源 重复 实现 并 行 性 。 

2) 并 行 处 理 机 

SIMD 和 MIMD 是 典型 的 并 行 计算 机 ，SIMD 有 共享 存储 器 和 分 布 存储 器 两 种 形式 。 

在 具有 共享 存储 器 的 SIMD 结构 (如 图 1-4 所 示 ) 中 ， 将 若干 个 存储 器 构成 统一 的 并 行 处 
理 机 存储 器 ， 通 过 互联 网 络 ICN 为 整个 并 行 系统 的 所 有 处 理 单 元 共享 。 其 中 ，PE 为 处 理 单元 ， 
CU 为 控制 部 件 ，M 为 共享 存储 器 ，ICN 为 互联 网 络 。 

分 布 式 存储 器 的 SIMD 结构 如 图 1-5 所 示 ， 其 中 ，PE 为 处 理 单元 ，CU 为 控制 部 件 ，PEM 
为 局 部 存储 器 ，ICN 为 互联 网 络 。 含 有 多 个 同样 结构 的 处 理 单元 ， 通 过 寻 径 网 络 ICN 以 一 定 的 
方式 互相 连接 。 


上 |---------------------- - 
cu | = | 
FE 区 | 
PE0 PE1 | | 
| [L PE! 6 PEn-1 -一 

EE (i | 


ICN |- 一 


图 1-4 具有 共享 存储 器 的 SIMD 结构 图 1-5 具有 分 布 存储 器 的 SIMD 结构 


MO MI 


时 20 荐 。 软 人 设计 师 教程 (第 5 版) 


分 布 存储 器 的 并 行 处 理 机 结构 中 有 两 类 存储 器 ， 一 类 存储 器 附属 于 主 处 理 机 ， 主 处 理 机 实 
现 整个 并 行 处 理 机 的 管理 ， 在 其 附属 的 存储 器 内 常 驻 操作 系统 。 另 一 类 是 分 布 在 各 个 处 理 单元 
上 的 存储 器 ( 即 PEM)》， 这 类 存储 器 用 来 保存 程序 和 数据 。 在 阵列 控制 部 件 的 统一 指挥 下 ， 实 
现 并 行 操作 。 程 序 和 数据 通过 主机 装 入 控制 存储 器 。 通 过 控制 部 件 的 是 单 指令 流 ， 所 以 指令 的 
执行 顺序 还 是 和 单 处 理 机 一 样 ， 基 本 上 是 串 行 处 理 。 指 令 送 到 控制 部 件 进行 译 码 。 划 分 后 的 数 
据 集合 通过 向 量 数据 总 线 分 布 到 所 有 PE 的 本 地 存储 器 PEM。PE 通过 数据 寻 径 网 络 互 连 。 数据 
寻 径 网 络 执行 PE 间 的 通信 。 控 制 部 件 通 过 执行 程序 来 控制 寻 径 网 络 。PE 的 同步 由 控制 部 件 的 
硬件 实现 。 

3) 多 处 理 机 

多 处 理 机 系统 是 由 多 台 处 理 机 组 成 的 系统 ， 每 台 处 理 机 有 属于 自己 的 控制 部 件 ， 可 以 执行 
独立 的 程序 ， 共 享 一 个 主 存储 器 和 所 有 的 外 部 设备 。 它 是 多 指令 流 多 数据 流 计算 机 。 在 多 处 理 
机 系统 中 ， 机 间 的 互 连 技术 决定 了 多 处 理 机 的 性 能 。 多 处 理 机 之 间 的 互 连 要 满足 高 频带 、 低 成 
本 、 连 接 方式 的 多 样 性 以 及 在 不 规则 通信 情况 下 连接 的 无 冲突 性 。 

4) 其 他 计算 机 

集群 一 般 是 指 连 接 在 一 起 的 两 个 或 多 个 计算 机 《〈 结 点 ) 。 集 群 计算 机 是 一 种 并 行 或 分 布 式 
处 理 系统 ， 由 很 多 连接 在 一 起 的 独立 计算 机 组 成 ， 像 一 个 单 集成 的 计算 机 资源 一 样 协同 工作 ， 
主要 用 来 解决 大 型 计算 问题 。 计 算 机 结 点 可 以 是 一 个 单 处 理 器 或 多 处 理 器 的 系统 ， 拥 有 内 存 、 
IO 设备 和 操作 系统 。 连 接 在 一 起 的 计算 机 集群 对 用 户 和 应 用 程序 来 说 像 一 个 单一 的 系统 ， 这 
样 的 系统 可 以 提供 一 种 价格 合理 的 且 可 获得 所 需 性 能 和 快速 而 可 靠 的 服务 的 解决 方案 。 


1.2.2 ”存储 系统 


1， 存 储 器 的 层次 结构 


计算 机 系统 中 可 能 包括 各 种 存储 器 ， 如 CPU 内 部 的 通用 寄存 器 组 、CPU 内 的 Cache (高 
速 缓存 ) 、CPU 外 部 的 Cache、 主 板 上 的 主 存储 器 、 主 板 外 的 联机 〈 在 线 ) 磁盘 存储 器 以 及 脱 
机 《离线 ) 的 磁带 存储 器 和 光盘 存储 器 等 。 不 同 特点 的 存储 器 通过 适当 的 硬件 、 软 件 有 机 地 组 
合 在 一 起 形成 计算 机 的 存储 体系 结构 ， 如 图 1-6 所 示 。 其 中 ，Cache 和 主 存 之 间 的 交互 功能 全 
部 由 硬件 实现 ， 而 主 存 与 辅 存 之 间 的 交互 功能 可 由 硬件 和 软件 结合 起 来 实现 。 


2. 存储 器 的 分 类 


1) 按 存储 器 所 处 的 位 置 分 类 
按 存储 器 所 处 的 位 置 可 分 为 内 存 和 外 存 。 
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主 存储 器 


联机 磁盘 存储 器 


/ 脱 机 光盘 、 磁 盘存 储 器 \ 


图 1-6 存储 系统 的 层次 结构 


(1) 内 存 。 也 称 为 主 存 ， 设 在 主机 内 或 主机 板 上 ， 用 来 存放 机 器 当前 运行 所 需要 的 程序 和 
数据 ， 以 便 向 CPU 提供 信息 。 相 对 于 外 存 ， 其 特点 是 容量 小 、 速 度 快 。 

(2) 外 存 。 也 称 为 辅 存 ， 如 磁盘 、 磁 带 和 光盘 等 ， 用 来 存放 当前 不 参加 运行 的 大 量 信息 ， 
而 在 需要 时 调 入 内 存 。 

2) 按 存 储 器 的 构成 材料 分 类 

按 构 成 存储 器 的 材料 可 分 为 磁 存 储 器 、 半 导体 存储 器 和 光 存 储 器 。 

(1) 磁 存 储 器 。 磁 存储 器 是 用 磁性 介质 做 成 的 ， 如 磁 芯 、 磁 泡 、 磁 膜 、 磁 鼓 、 磁 带 及 磁 
盘 等 。 
(2) 半导体 存储 器 。 根 据 所 用 元 件 又 可 分 为 双 极 型 和 MOS 型 ， 根 据 数据 是 否 需 要 刷新 又 
可 分 为 静态 (Static Memory〉 和 动态 (Dynamic Memory) 两 类 。 

(3) 光 存储 器 。 利 用 光学 方法 读 / 写 数据 的 存储 器 ， 如 光盘 (Optical Disk) 。 

3) 按 存储 器 的 工作 方式 分 类 

按 存 储 器 的 工作 方式 可 分 为 读 / 写 存储 器 和 只 读 存储 器 。 

(1) 读 / 写 存储 器 (Random Access Memory，RAM) 。 它 指 既 能 读 取 数 据 也 能 存 入 数据 的 
存储 器 。 

(2) 只 读 存储 器 。 工 作 过程 中 仅 能 读 取 的 存储 器 ， 根 据 数据 的 写 入 方式 ， 这 种 存储 器 又 可 
细 分 为 ROM、PROM、EPROM 和 EEPROM 等 类 型 。 

Q@ 固定 只 读 存 储 器 (Read Only Memory，ROM) 。 这 种 存储 器 是 在 厂家 生产 时 就 写 好 数 
据 的 ， 其 内 容 只 能 读 出 ， 不 能 改变 。 一 般 用 于 存放 系统 程序 BIOS 和 用 于 微 程序 控制 。 

@ 可 编程 的 只 读 存储 器 (Programmable Read Only Memory，PROM) 。 其 中 的 内 容 可 以 
由 用 户 一 次 性 地 写 入 ， 写 入 后 不 能 再 修改 。 
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@ 可 探 除 可 编程 的 只 读 存储 器 〈Erasable Programmable Read Only Memory，EPROM) 。 
其 中 的 内 容 既 可 以 读 出 ， 也 可 以 由 用 户 写 入 ， 写 入 后 还 可 以 修改 。 改 写 的 方法 是 写 入 之 前 先 用 
紫外 线 照射 15 一 20 分 钟 以 探 去 所 有 信息 ， 然 后 再 用 特殊 的 电子 设备 写 入 信息 。 

@ 电 擦 除 可 编程 的 只 读 存 储 器 (Electrically Erasable Programmable Read Only Memory， 
EEPROM) 。 与 EPROM 相似 ，EEPROM 中 的 内 容 既 可 以 读 出 ， 也 可 以 进行 改写 。 只 不 过 这 种 
存储 器 是 用 电 擦 除 的 方法 进行 数据 的 改写 。 

@ 闪 速 存储 器 (Flash Memory) 。 简 称 闪存 ， 闪 存 的 特性 介 于 EPROM 和 EEPROM 之 间 ， 
类 似 于 EEPROM， 也 可 使 用 电信 号 进行 信息 的 控 除 操作 。 整 块 闪存 可 以 在 数秒 内 删除 ， 速 度 远 
快 于 EPROM。 

4) 按 访问 方式 分 类 

按 访 问 方式 可 分 为 按 地 址 访问 的 存储 器 和 按 内 容 访问 的 存储 器 。 

5) 按 寻 址 方式 分 类 

按 寻 址 方式 可 分 为 随机 存储 器 、 顺 序 存 储 器 和 直接 存储 器 。 

(1) 随机 存储 器 (Random Access Memory，RAM) 。 这 种 存储 器 可 对 任何 存储 单元 存 入 
或 读 取 数 据 ， 访 问 任何 一 个 存储 单元 所 需 的 时 间 是 相同 的 。 

(2) 顺序 存储 器 (Sequentially Addressed Memory，SAM) 。 访 问 数 据 所 需要 的 时 间 与 数据 
所 在 的 存储 位 置 相关 ， 磁 带 是 典型 的 顺序 存储 器 。 

(3) 直接 存储 器 (Direct Addressed Memory，DAM) 。 介 于 随机 存 取 和 顺序 存 取 之 间 的 一 
种 寻 址 方式 。 磁 盘 是 一 种 直接 存 取 存 储 器 ， 它 对 磁道 的 寻 址 是 随机 的 ， 而 在 一 个 磁道 内 则 是 顺 
序 寻 址 。 


3. 相 联 存储 器 


相 联 存储 器 是 一 种 按 内 容 访问 的 存储 器 。 其 工作 原理 就 是 把 数据 或 数据 的 某 一 部 分 作为 关 
键 字 ， 按 顺序 写 入 信息 ， 读 出 时 并 行 地 将 该 关键 字 与 存储 器 中 的 每 一 单元 进行 比较 ， 找 出 存储 
器 中 所 有 与 关键 字 相 同 的 数据 字 ， 特 别 适合 于 信息 的 检索 和 更 新 。 

相 联 存储 器 的 结构 如 图 1-7 所 示 , 其 中 , 输入 检索 寄存 器 用 来 存放 要 检索 的 内 容 ( 关 键 字 )， 
屏蔽 寄存 器 用 来 屏蔽 那些 不 参与 检索 的 字段 ， 比 较 器 将 检索 的 关键 字 与 存储 体 的 每 一 单元 进行 
比较 。 为 了 提高 速度 ， 比 较 器 的 数量 应 很 大 。 对 于 位 比较 器 ， 应 每 位 对 应 一 个 , 应 有 2"XN 个 ， 
对 于 字 比 较 器 应 有 2” 个 。 匹 配 寄存 器 用 来 记录 比较 的 结果 ， 它 应 有 2” 个 二 进 制 位 ， 用 来 记录 
2” 个 比较 器 的 结果 ，1 为 相等 〈 匹 配 ) ，0 为 不 相等 〈 不 匹配 ) 。 

相 联 存储 器 可 用 在 高 速 缓冲 存储 器 中 , 在 虚拟 存储 器 中 用 来 作为 段 表 、 页 表 或 快 表 存储 器 ， 
用 在 数据 库 和 知识 库 中 。 
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图 1-7 相 联 存储 器 的 结构 框图 


地 址 寄 
存 器 


4. 高 速 缓存 


高 速 缓存 用 来 存放 当前 最 活跃 的 程序 和 数据 ， 其 特点 是 : 位 于 CPU 与 主 存 之 间 ; 容量 一 
般 在 几 千 字 节 到 几 兆 字 节 之 间 ; 速度 一 般 比 主 存 快 $ 一 10 倍 ， 由 快速 半导体 存储 器 构成 ， 其 内 
容 是 主 存 局 部 域 的 副本 ， 对 程序 员 来 说 是 透明 的 。 

1) 高 速 缓存 的 组 成 

高 速 缓存 〈Cache) 、 主 存 (Main Memory) 与 CPU 的 关系 如 图 1-8 所 示 。 


Cache | 一 | CPU Core | 


图 1-8 高 速 缓存 、 主 存 和 CPU 的 关系 示意 图 


Cache 存储 器 部 分 用 来 存放 主 存 的 部 分 拷贝 (副本 ) 信息。 控制 部 分 的 功能 是 判断 CPU 要 
访问 的 信息 是 否 在 Cache 存储 器 中 ， 若 在 即 为 命中 ， 若 不 在 则 没有 命中 。 命 中 时 直接 对 Cache 
存储 器 寻 址 ; 未 命中 时 ， 要 按照 蔡 换 原则 决定 主 存 的 一 块 信息 放 到 Cache 存储 器 的 哪 一 块 里 。 

现代 CPU 中 Cache 分 为 了 多 个 层级 ， 如 图 1-9 所 示 。 
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图 1-9 三 级 Cache 示意 图 


2) 高 速 缓存 中 的 地 址 映像 方法 
在 CPU 工作 时 ， 送 出 的 是 主 存单 元 的 地 址 ， 而 应 从 Cache 存储 器 中 读 / 写 信息 。 这 就 需要 
将 主 存 地 址 转换 成 Cache 存储 器 的 地 址 ， 这 种 地 址 的 转换 称 为 地 址 映像 。Cache 的 地 址 映像 有 


如 下 3 种 方法 。 


(1) 直接 映像 。 直 接 映 像 是 指 主 存 的 块 与 Cache 块 的 对 应 关系 是 固定 的 ， 如 图 1-10 所 示 。 


主 存 地 址 


第 0 块 


主 存 区 号 


区 内 块 号 ”| 。 块 内 地 址 


图 1-10 直接 映像 示意 图 


风 
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在 这 种 映像 方式 下 ， 由 于 主 存 中 的 块 只 能 存放 在 Cache 存储 器 的 相同 块 号 中 ， 因 此 ， 只 要 
主 存 地 址 中 的 主 存 区 号 与 Cache 中 记录 的 主 存 区 号 相同 ， 则 表明 访问 Cache 命中 。 一 旦 命中 ， 
由 主 存 地 址 中 的 区 内 块 号 立即 可 得 到 要 访问 的 Cache 存储 器 中 的 块 ， 而 块 内 地 址 就 是 主 存 地 址 
中 给 出 的 低位 地 址 。 

直接 映像 方式 的 优点 是 地 址 变换 很 简单 ， 缺 点 是 灵活 性 差 。 例 如 ,不同 区 号 中 块 号 相同 的 
块 无 法 同时 调 入 Cache 存储 器 ， 即 使 Cache 存储 器 中 有 空 着 的 块 也 不 能 利用 。 

(2) 全 相 联 映像 。 全 相 联 映像 如 图 1-11 所 示 。 同 样 ， 主 存 与 Cache 存储 器 均 分 成 大 小 相同 
的 块 。 这 种 映像 方式 允许 主 存 的 任 一 块 可 以 调 入 Cache 存储 器 的 任何 一 个 块 的 空间 中 。 


主 存 地 址 主 存 块 号 块 内 地 址 


图 1-11 全 相 联 映像 示意 图 


例如 ， 主 存 为 64MB，Cache 为 32KB， 块 的 大 小 为 4KB 〈 块 内 地 址 需要 12 位 ) ， 因 此 主 
存 分 为 16384 块 ， 块 号 从 0 一 16383， 表 示 块 号 需要 14 位 ，Cache 分 为 8 块 ， 块 号 为 0 一 7， 表 
示 块 号 需 3 位 。 存 放 主 存 块 号 的 相 联 存储 器 需要 有 Cache 块 个 数 相同 数目 的 单元 (该 例 中 为 8)， 
相 联 存储 器 中 每 个 单元 记录 所 存储 的 主 存 块 的 块 号 ， 该 例 中 相 联 存储 器 每 个 单元 应 为 14 位 ， 
共 8 个 单元 。 

在 地 址 变换 时 , 利用 主 存 地 址 高 位 表示 的 主 存 块 号 与 Cache 中 相 联 存储 器 所 有 单元 中 记录 
的 主 存 块 号 进行 比较 ， 若 相同 即 为 命中 。 这 时 相 联 存储 器 单元 的 编号 就 对 应 要 访问 Cache 的 块 
号 ， 从 而 在 相应 的 Cache 块 中 根据 块 内 地 址 (上 例 中 块 内 地 址 是 12 位 ，Cache 与 主 存 的 块 内 地 
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址 是 相同 的 ) 访问 到 相应 的 存储 单元 。 

全 相 联 映像 的 主要 优点 是 主 存 的 块 调 入 Cache 的 位 置 不 受 限 制 ， 十 分 灵活 。 其 主要 缺点 是 
无 法 从 主 存 块 号 中 直接 获得 Cache 的 块 号 ， 变 换 比 较 复 杂 ， 速 度 比较 慢 。 

(3) 组 相 联 映 像 。 这 种 方式 是 前 面 两 种 方式 的 折 中 。 具 体 方法 是 将 Cache 中 的 块 再 分 成 组 。 
例如 ， 假 定 Cache 有 16 块 ， 再 将 每 两 块 分 为 1 组 ， 则 Cache 就 分 为 8 组 。 主 存 同 样 分 区 ， 每 
区 16 块 ， 再 将 每 两 块 分 为 1 组 ， 则 每 区 就 分 为 8 组 。 

组 相 联 映像 就 是 规定 组 采用 直接 映像 方式 而 块 采用 全 相 联 映像 方式 。 也 就 是 说 ， 主 存 任何 
区 的 0 组 只 能 存 到 Cache 的 0 组 中 ，1 组 只 能 存 到 Cache 的 1 组 中 ， 依 此 类 推 。 组 内 的 块 则 采 
用 全 相 联 映像 方式 ， 即 一 组 内 的 块 可 以 任意 存放 。 也 就 是 说 ， 主 存 一 组 中 的 任 一 块 可 以 存 入 
Cache 相应 组 的 任 一 块 中 。 

在 这 种 方式 下 , 通过 直接 映像 方式 来 决定 组 号 , 在 一 组 内 再 用 全 相 联 映像 方式 来 决定 Cache 
中 的 块 号 。 由 主 存 地 址 高 位 决定 的 主 存 区 号 与 Cache 中 区 号 比较 可 决定 是 否 命中 。 主 存 后 面 的 
地 址 即 为 组 号 。 

3) 替换 算法 

替换 算法 的 目标 就 是 使 Cache 获得 尽 可 能 高 的 命中 率 。 常 用 算法 有 如 下 几 种 。 

(1) 随机 替换 算法 。 就 是 用 随机 数 发 生 器 产生 一 个 要 替换 的 块 号 ， 将 该 块 替换 出 去 。 

(2) 先进 先 出 算法 。 就 是 将 最 先进 入 Cache 的 信息 块 替换 出 去 。 

(3) 近期 最 少 使 用 算法 。 这 种 方法 是 将 近期 最 少 使 用 的 Cache 中 的 信息 块 蔡 换 出 去 。 

(4) 优化 替换 算法 。 这 种 方法 必须 先 执行 一 次 程序 ， 统 计 Cache 的 替换 情况 。 有 了 这 样 的 
先 验 信息 ， 在 第 二 次 执行 该 程序 时 便 可 以 用 最 有 效 的 方式 来 替换 。 

4) Cache 的 性 能 分 析 

Cache 的 性 能 是 计算 机 系统 性 能 的 重要 方面 。 命 中 率 是 Cache 的 一 个 重要 指标 ， 但 不 是 最 
主要 的 指标 。Cache 设计 的 目标 是 在 成 本 允许 的 条 件 下 达到 较 高 的 命中 率 ， 使 存储 系统 具有 最 
短 的 平均 访问 时 间 。 设 瓦 为 Cache 的 命中 率 ，t. 为 Cache 的 存 取 时 间 ， 为 主 存 的 访问 时 间 ， 
则 Cache 存储 器 的 等 效 加 权 平 均 访问 时 间 为 : 

b=Ht+(-—H)t, =t +(—H.), 一) 
这 里 假设 Cache 访问 和 主 存 访问 是 同时 启动 的 ， 其 中 ,tc 为 Cache 命中 时 的 访问 时 间 ，( -大 ) 
为 失效 访问 时 间 。 如 果 在 Cache 不 命中 时 才 启 动 主 存 ， 则 
t=€+0 -Hs 

在 指令 流水 线 中 ，Cache 访问 作为 流水 线 中 的 一 个 操作 阶段 ，Cache 失效 将 影响 指令 的 流 

水 。 因 此 ， 降 低 Cache 的 失效 率 是 提高 Cache 性 能 的 一 项 重要 措施 。 当 Cache 容量 比较 小 时 ， 
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容量 因素 在 Cache 失效 中 占有 比较 大 的 比例 。 降 低 Cache 失效 率 的 方法 主要 有 选择 恰当 的 块 容 
量 、 提 高 Cache 的 容量 和 提高 Cache 的 相 联 度 等 。 

Cache 的 命中 率 与 Cache 容量 的 关系 如 图 1-12 所 示 。Cache 容量 越 大 ， 则 命中 率 越 高 ， 随 
着 Cache 容量 的 增加 ， 其 失效 率 接近 0% 〈 命 中 率 逐 渐 接 近 100% ) 。 但 是 ， 增 加 Cache 容量 
意味 着 增加 Cache 的 成 本 和 增加 Cache 的 命中 时 间 。 


命中 率 H 


容量 S 


图 1-12 Cache 容量 与 命中 率 的 关系 


5) 多 级 Cache 

在 多 级 Cache 的 计算 机 中 , Cache 分 为 一 级 (L1 Cache)、 二 级 (L2 Cache)、 三 级 (L3 Cache) 
等 ，CPU 访 存 时 首先 查找 Ll1 Cache， 如 果 不 命中 ， 则 访问 L2 Cache， 直 到 所 有 级 别 的 Cache 
都 不 命中 ， 才 访问 主 存 。 通 常 要 求 Ll Cache 的 速度 足够 快 ， 以 赶 上 CPU 的 主 频 。 如 果 Cache 
为 两 级 ， 则 Ll1 Cache 的 容量 一 般 都 比较 小 ， 为 几 千 字 节 到 几 十 千 字 节 ; L2 Cache 则 具有 较 高 
的 容量 ， 一 般 为 几 百 字 节 到 几 兆 字 节 ， 以 使 高 速 缓存 具有 足够 高 的 命中 率 。 

S， 虚 拟 存储 器 

在 概念 上 ， 可 以 将 主 存 存储 器 看 作 一 个 由 若干 个 字 节 构成 的 存储 空间 ， 每 个 字 节 ( 称 为 一 
个 存储 单元 ) 有 一 个 地 址 编号 ， 主 存单 元 的 该 地 址 称 为 物理 地 址 (Physical Address) 。 当 需要 
访问 主 存 中 的 数据 时 , 由 CPU 给 出 要 访问 数据 所 在 的 存储 单元 地 址 , 然后 由 主 存 的 读 写 控制 部 
件 定位 对 应 的 存储 单元 ， 对 其 进行 读 〈 或 写 ) 操作 来 完成 访问 操作 。 

现代 系统 提供 了 一 种 对 主 存 的 抽象 , 称 为 虚拟 存储 (Virtual Memory), 使 用 虚拟 地 址 (Virtual 
Address,， 由 CPU 生成 ) 的 概念 来 访问 主 存 ， 使 用 专门 的 MMU (Memory Management Unit) 将 
虚拟 地 址 转换 为 物理 地 址 后 访问 主 存 。 设 主 存 容量 为 4GB， 则 其 简化 后 的 访问 操作 和 内 存 模型 
如 图 1-13 所 示 。 


国医 
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主 存 


十 站 0x00000000 
物理 地 址 | 
pe 0x00000001 


0x0022ffs8 
0x0022ff59 
0x0022ffsa 
0x0022ffsb 


0Oxffffffff 


数据 字 


图 1-13 内存 模型 及 使 用 虚拟 地 址 访 存 示意 图 


虚拟 存储 器 实际 上 是 一 种 逻辑 存储 器 ， 实 质 是 对 物理 存储 设备 进行 逻辑 化 的 处 理 ， 并 将 统 
一 的 逻辑 视图 呈现 给 用 户 。 因 此 ， 用 户 在 使 用 时 ， 操 作 的 是 虚拟 设备 ， 无 需 关心 底层 的 物理 环 
境 ， 从 而 可 以 充分 利用 基于 异 构 平台 的 存储 空间 ， 达 到 最 优化 的 使 用 效率 。 


6. 外 存储 器 


外 存储 器 用 来 存放 暂时 不 用 的 程序 和 数据 ， 并且 以 文件 的 形式 存储 。CPU 不 能 直接 访问 外 
存 中 的 程序 和 数据 ， 只 有 将 其 以 文件 为 单位 调 入 主 存 才 可 访问 。 外 存储 器 主要 由 磁 表 面 存储 器 
(如 磁盘 、 磁 带 ) 、 光 盘存 储 器 及 固态 硬盘 (采用 Flash 芯片 或 DRAM 作为 存储 介质 的 存储 器 ) 
构成 。 

1) 磁 表 面 存储 器 

在 磁 表 面 存储 器 中 ， 磁 盘 的 存 取 速度 较 快 ， 且 具有 较 大 的 存储 容量 ， 是 目前 广泛 使 用 的 外 
存储 器 。 磁 盘存 储 器 由 盘 片 、 驱 动 器 、 控 制 器 和 接口 组 成 。 盘 片 用 来 存储 信息 。 驱 动 器 用 于 驱 
动 磁 头 沿 盘面 径 向 运动 以 寻找 目标 磁道 位 置 ， 驱 动 盘 片 以 额定 速率 稳定 旋转 ， 并 且 控制 数据 的 
写 入 和 读 出 。 控 制 器 接收 主机 发 来 的 命令 ， 将 它 转 换 成 磁盘 驱动 器 的 控制 命令 ， 并 实现 主机 和 
驱动 器 之 间 数 据 格式 的 转换 及 数据 传送 ， 以 控制 驱动 器 的 读 / 写 操作 。 一 个 控制 器 可 以 控制 一 台 
或 多 台 驱 动 器 。 接 口 是 主机 和 磁盘 存储 器 之 间 的 连接 逻辑 。 

硬盘 是 最 常见 的 外 存储 器 。 一 个 硬盘 驱动 器 内 可 装 有 多 个 盘 片 ， 组 成 盘 片 组 ,每 个 盘 片 都 
配 有 一 个 独立 的 磁头 。 所 有 记录 面 上 相同 序号 的 磁道 构成 一 个 圆柱 面 , 其 编号 与 磁道 编号 相同 。 
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将 文件 存储 在 硬盘 上 时 尽 可 能 放 在 同一 圆柱 面 上 ， 或 者 放 在 相 邻 柱 面 上 ， 这 样 可 以 缩短 寻 道 
时 间 。 

为 了 正确 地 存储 信息 ， 将 盘 片 划 成 许多 同心 圆 ， 称 为 磁道 ， 从 外 到 里 编号 ， 最 外 一 圈 为 0 
道 , 往 内 道 号 依次 增加 。 沿 径 向 的 单位 距离 的 磁道 数 称 为 道 密度 ， 单 位 为 tpi (每 英寸 磁道 数 ) 。 
将 一 个 磁道 沿 圆周 等 分 为 若干 段 ， 每 段 称 为 一 个 扇 段 或 扇 区 ， 每 个 扇 区 内 可 存放 一 个 固定 长 度 
的 数据 块 ， 如 512B。 磁 道上 单位 距离 可 记录 的 位 数 称 为 位 密度 ， 单 位 为 bpi (每 英寸 位 数 ) 。 
因为 每 条 磁道 上 的 扇 区 数 相 同 , 而 每 个 扇 区 的 大 小 又 一 样 , 所 以 每 条 磁道 都 记录 同样 多 的 信息 。 
又 因为 里 圈 磁 道 圆周 比 外 圈 磁 道 的 圆周 小 ， 所 以 里 圈 磁 道 的 位 密度 要 比 外 圈 磁 道 的 位 密度 高 。 
最 内 圈 的 位 密度 称 为 最 大 位 密度 。 

硬盘 的 寻 址 信息 由 硬盘 驱动 号 、 圆 柱 面 号 、 磁 头号 (记录 面 号 ) 、 数 据 块 号 (或 扇 区 号 ) 
以 及 交换 量 组 成 。 

磁盘 容量 有 两 种 指标 : 一 种 是 非 格 式 化 容量 ， 它 是 指 一 个 磁盘 所 能 存储 的 总 位 数 ， 另 一 种 
是 格式 化 容量 ， 它 是 指 各 扇 区 中 数据 区 容量 的 总 和 。 计 算 公 式 分 别 如 下 

非 格式 化 容量 = 面 数 X 〈 磁 道 数 / 面 ) X 内 圆周 长 X 最 大 位 密度 
格式 化 容量 = 面 数 X 〈 磁 道 数 / 面 ) X 〈 扇 区 数 / 道 ) x 〈 字 节 数 / 扇 区 ) 

按 盘 片 是 否 固定 、 磁 头 是 否 移动 等 指标 ， 硬 盘 可 分 为 移动 磁头 固定 盘 片 的 磁盘 存储 器 、 固 
定 磁 头 的 磁盘 存储 器 、 移 动 磁头 可 换 盘 片 的 磁盘 存储 器 和 温 彻 斯 特 磁盘 存储 器 〈 简 称 温 盘 ) 。 

2) 光盘 存储 器 

光盘 存储 器 是 一 种 采用 聚焦 激光 束 在 盘 式 介质 上 非 接触 地 记录 高 密度 信息 的 新 型 存储 
装置 。 

根据 性 能 和 用 途 , 光盘 存储 器 可 分 为 只 读 型 光盘 (CD-ROM) 、 只 写 一 次 型 光盘 (WORM) 
和 可 擦 除 型 光盘 。 只 读 型 光盘 是 由 生产 厂家 预先 用 激光 在 盘 片 上 蚀刻 不 能 再 改写 的 各 种 信息 ， 
目前 这 类 光盘 的 使 用 很 普遍 。 只 写 一 次 型 光盘 是 指 由 用 户 一 次 写 入 、 可 多 次 读 出 但 不 能 擦 除 的 
光盘 ， 写 入 方法 是 利用 聚焦 激光 束 的 热能 ， 使 光盘 表面 发 生 永久 性 变化 而 实现 的 。 可 探 除 型 光 
盘 是 读 / 写 型 光 极 ， 它 是 利用 激光 照射 引起 介质 的 可 道 性 物理 变化 来 记录 信息 。 

光盘 存储 器 由 光学 、 电 学 和 机 械 部 件 等 组 成 。 其 特点 是 记录 密度 高 、 存 储 容量 大 、 采 用 非 
接触 式 读 / 写 信息 光头 距离 光盘 通常 为 2mm) 、 信 息 可 长 期 保存 (其 寿命 达 10 年 以 上 ) 、 采 
用 多 通道 记录 时 数据 传送 率 可 超过 200Mb/s、 制 造成 本 低 、 对 机 械 结 构 的 精度 要 求 不 高 、 存 取 
时 间 较 长 。 

3) 固态 硬盘 

固态 硬盘 的 存储 介质 分 为 两 种 ， 一 种 是 采用 闪存 (FLASH 芯片 ) 作为 存储 介质 ， 另 外 一 
种 是 采用 DRAM 作为 存储 介质 。 
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基于 闪存 的 固态 硬盘 是 固态 硬盘 的 主要 类 别 ， 其 主体 是 一 块 PCB 板 ， 板 上 最 基本 的 配件 
就 是 控制 芯片 、 缓 存 芯片 和 用 于 存储 数据 的 闪存 芯片 。 主 控 芯 片 是 固态 硬盘 的 大 脑 ， 其 作用 有 
两 个 : 一 是 合理 调配 数据 在 各 个 闪存 芯片 上 的 负荷 ， 二 则 是 承担 数据 中 转 的 作用 ， 连 接 闪存 芯 
片 和 外 部 SATA 接口 。 不 同 主 控 芯 片 的 能 力 相 差 非常 大 ， 在 数据 处 理 能 力 、 算 法 ， 对 闪存 芯片 
的 读 取 写 入 控制 上 会 有 非常 大 的 不 同 ， 直 接 会 导致 固态 硬盘 产品 在 性 能 上 差距 很 大 。 

固态 硬盘 的 接口 规范 和 定义 、 功 能 及 使 用 方法 上 与 普通 硬盘 基本 相同 ， 外 形 和 尺寸 也 基本 
与 普通 的 2.5 英寸 硬盘 一 致 。 

固态 硬盘 具有 传统 机 械 硬 盘 不 具备 的 读 写 快速 、 质 量 轻 、 能 耗 低 以 及 体积 小 等 特点 ， 但 其 
价格 仍 较为 昂贵 ， 容 量 较 低 ， 一 旦 硬件 损坏 ， 数 据 较 难 恢复 。 


7. 磁盘 阵列 技术 


磁盘 阵列 是 由 多 台 磁 盘存 储 器 组 成 的 一 个 快速 、 大 容量 、 高 可 靠 的 外 存 子 系统 。 现 在 常见 
的 磁盘 阵列 称 为 廉价 元 余 磁盘 阵列 (Redundant Array of Independent Disk，RAID) 。 目 前 ， 常 
见 的 RAID 如 表 1-4 所 示 。 


表 1-4 廉价 元 余 磁 盘 阵 列 
RAID 级 别 说 ”了 明 
RAID-0 是 一 种 不 具备 容错 能 力 的 磁盘 阵列 。 由 六 个 磁极 存储 器 组 成 的 0 级 阵列 , 其 平均 
RAID-0 故障 间隔 时 间 (MTBF) 是 单个 磁盘 存储 器 的 入 分 之 一 ， 但 数据 传输 率 是 单个 磁盘 存储 
器 的 倍 
RAID-1 RAID-1 是 采用 镜像 容错 改善 可 靠 性 的 一 种 磁 枚 阵列 
RAID-2 RAID-2 是 采用 海 明 码 进行 错误 检测 的 一 种 磁盘 阵列 
RAID-3 减少 了 用 于 检验 的 磁盘 存储 器 的 个 数 ， 从 而 提高 了 磁极 阵列 的 有 效 容 量 。 一 般 只 
有 一 个 检验 盘 
RAID-4 RAID-4 是 一 种 可 独立 地 对 组 内 各 磁盘 进行 读 / 写 的 磁盘 阵列 ， 该 阵列 也 只 用 一 个 检验 盘 
RAID-5 是 对 RAID-4 的 一 种 改进 ， 它 不 设置 专门 的 检验 盘 。 同 一 个 磁盘 上 既 记 录 数 据 ， 
也 记录 检验 信息 ， 这 就 解决 了 前 面 多 个 磁盘 机 争 用 一 个 检验 盘 的 问题 
RAID-6 磁盘 阵列 采用 两 级 数据 元 余 和 新 的 数据 编码 以 解决 数据 恢复 问题 ,使 在 两 个 磁盘 
RAID-6 出 现 故障 时 仍然 能 够 正常 工作 .在 进行 写 操作 时 , RAID-6 分 别 进行 两 个 独立 的 校 验 运 算 ， 
形成 两 个 独立 的 宛 余 数据 ， 写 入 两 个 不 同 的 磁 般 


RAID-3 


RAID-5 


除 此 之 外 ， 上 述 各 种 类 型 的 RAID 还 可 以 组 合 起 来 ， 构 成 复合 型 的 RAID， 此 处 不 再 歼 述 。 
8， 存储 域 网 络 
在 大 型 服务 器 系统 的 背后 都 有 一 个 网 络 ， 把 一 个 或 多 个 服务 器 与 多 个 存储 设备 连接 起 来 ， 
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每 个 存储 设备 可 以 是 RAID、 磁 带 备 份 系统 、 磁 
带 库 和 CD-ROM 库 等 ， 构 成 了 存储 域 网 络 
(Storage Area Network，SAN) 。 这 样 的 网 络 不 
仅 解 决 了 服务 器 对 存储 容量 的 要 求 , 还 可 以 使 多 
服务 器 之 间 共 享 文件 系统 和 辅助 存储 空间 , 避 
免 数据 和 程序 代码 的 重复 存储 , 提高 辅助 存储 器 
的 利用 率 。 另 外 ，SAN 还 实现 了 分 布 式 存储 系 


本 


存储 池 
统 的 集中 管理 , 降低 了 大 容量 存储 系统 的 管理 成 RAID RAID RAID 
本 , 提高 了 管理 效率 。 存 储 域 网 络 是 连接 服务 器 到 2 a 
与 存储 设备 的 网 络 , 它 能 够 将 多 个 分 布 在 不 同 地 
点 的 RAID 组 织 成 一 个 逻辑 存储 设备 , 供 多 个 服 
图 1-14 SAN 的 结 


务 器 共享 访问 ， 如 图 1-14 所 示 。 
1.2.3 输入 /输出 技术 


1. 微型 计算 机 中 最 常用 的 内 存 与 接口 的 编 址 方法 


计算 机 系统 中 存在 多 种 内 存 与 接口 地 址 的 编 址 方法 ， 常 见 的 是 下 面 两 种 : 内 存 与 接口 地 址 
独立 编 址 和 内 存 与 接口 地 址 统一 编 址 。 
1) 内 存 与 接口 地 址 独立 编 址 方法 
在 内 存 与 接口 地 址 独立 编 址 方法 下 ， 内 存 地 址 和 接口 地 址 是 完全 独立 的 两 个 地 址 空间 ， 它 
们 是 完全 独立 的 并 且 是 相互 隔离 的 。 访 问 数据 时 所 使 用 的 指令 也 完全 不 同 ， 用 于 接口 的 指令 只 
用 于 接口 的 读 / 写 , 其 余 的 指令 全 都 是 用 于 内 存 的 。 因 此 , 在 编程 序 或 读 程序 时 很 易 使 用 和 辨认 。 
这 种 编 址 方法 的 缺点 是 用 于 接口 的 指令 太 少 、 功 能 太 弱 。 
2) 内 存 与 接口 地 址 统一 编 址 方法 
在 这 种 编 址 方法 中 ， 内 存 地址 和 接口 地 址 统一 在 一 个 公共 的 地 址 空间 里 ， 即 内 存单 元 和 接 
共用 地 址 空间 。 在 这 些 地 址 空间 里 划分 出 一 部 分 地 址 分 配给 接口 使 用 ， 其 余地 址 归 内 存单 元 
使 用 。 分 配给 内 存 的 地 址 区 间 只 能 用 于 内 存单 元 ， 接 口 绝 不 允许 使 用 。 同 样 ， 分 配给 接口 的 地 
址 区 间 内 存单 元 也 绝 不 能 使 用 。 
这 种 编 址 方法 的 优点 是 原则 上 用 于 内 存 的 指令 全 都 可 以 用 于 接口 , 这 就 大 大 地 增强 了 对 接 
口 的 操作 功能 ， 而 且 在 指令 上 也 不 再 区 分 内 存 或 接口 指令 。 
该 编 址 方法 的 缺点 就 在 于 整个 地 址 空间 被 分 成 两 部 分 ， 其 中 一 部 分 分 配给 接口 使 用 ， 剩余 
的 为 内 存 所 用 ， 这 经 常会 导致 内 存 地 址 不 连续 。 由 于 用 于 内 存 的 指令 和 用 于 接口 的 指令 是 完全 
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一 样 的 ， 维 护 程序 时 就 需要 根据 参数 定义 表 仔 细 加 以 辨认 。 
2. 直接 程序 控制 


直接 程序 控制 是 指 外 设 数据 的 输入 /输出 过 程 是 在 CPU 执行 程序 的 控制 下 完成 的 。 这 种 方式 
分 为 无 条 件 传送 和 程序 查询 方式 两 种 情况 。 

1) 无 条 件 传送 

在 此 情况 下 ， 外 设 总 是 准备 好 的 ， 它 可 以 无 条 件 地 随时 接收 CPU 发 来 的 输出 数据 ， 也 能 够 
无 条 件 地 随时 向 CPU 提供 需要 输入 的 数据 。 

2) 程序 查询 方式 

在 这 种 方式 下 , 利用 查询 方式 进行 输入 /输出 , 就 是 通过 CPU 执行 程序 来 查询 外 设 的 状态 
判断 外 设 是 否 准备 好 接收 数据 或 准备 好 了 向 CPU 输入 的 数据 。 根 据 这 种 状态 ，CPU 有 针对 性 
地 为 外 设 的 输入 /输出 服务 。 

通常 ， 一 个 计算 机 系统 中 可 以 存在 着 多 种 不 同 的 外 设 ， 如 果 这 些 外 设 是 用 查询 方式 工作 
则 CPU 应 对 这 些 外 设 逐 一 进行 查询 , 发 现 哪个 外 设 准备 就 绪 就 对 该 外 设 服务 。 这 种 工作 方式 有 
如 下 两 大 缺点 。 

(1) 降低 了 CPU 的 效率 。 在 这 种 工作 方式 下 ，CPU 不 做 别 的 事 ， 只 是 不 停 地 对 外 设 的 状态 进 
行 查询 。 在 实际 的 工程 应 用 中 ， 对 于 那些 慢 速 的 外 设 ， 在 不 影响 外 设 工作 的 情况 下 ，CPU 应 可 
以 执行 其 他 任务 。 

(2) 对 外 部 的 突 发 事件 无 法 做 出 实时 响应 。 

3. 中 断 方式 


由 程序 控制 IO 的 方法 ,其 主要 缺点 在 于 CPU 必须 等 待 IO 系统 完成 数据 的 传输 任务 ,在 
此 期 间 CPU 需 定期 地 查询 IO 系统 的 状态 ， 以 确认 传输 是 否 完成 。 因此， 整个 系统 的 性 能 严重 
下 降 。 

利用 中 断 方式 完成 数据 的 输入 /输出 过 程 为 : 当 LO 系统 与 外 设 交换 数据 时 , CPU 无 须 等 待 
也 不 必 去 查询 IO 的 状态 ， 而 可 以 抽身 出 来 处 理 其 他 任务 。 当 IO 系统 准备 好 以 后 ， 则 发 出 中 
断 请 求 信号 通知 CPU，CPU 接 到 中 断 请 求 信号 后 ， 保 存 正在 执行 程序 的 现场 ， 转 入 IO 中 断 服 
务 程序 的 执行 ， 完 成 与 IO 系统 的 数据 交换 ， 然 后 再 返回 被 打 断 的 程序 继续 执行 。 与 程序 控制 
方式 相 比 ， 中 断 方式 因为 CPU 无 须 等 待 而 提高 了 效率 。 

1) 中 断 处 理 方法 

在 系统 中 具有 多 个 中 断 源 的 情况 下 , 常用 的 处 理 方法 有 多 中 断 信 号 线 法 (Multiple Interrupt 
Lines) 、 中 断 软件 查询 法 〈Software Poll) 、 菊 花 链 法 (Daisy Chain) 、 总 线 仲裁 法 和 中 断 向 
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(1) 多 中 断 信 号 线 法 。 每 个 中 断 源 都 有 属于 自己 的 一 根 中 断 请 求 信号 线 向 CPU 提出 中 断 
请 求 。 
(2) 中 断 软 件 查询 法 。 当 CPU 检测 到 一 个 中 断 请 求 信号 以 后 ， 即 转 入 到 中 断 服务 程序 去 
轮 询 每 个 中 断 源 以 确定 是 谁 发 出 了 中 断 请 求 信号 。 对 各 个 设备 的 响应 优先 级 由 软件 设 定 。 

(3) 菊花 链 法 。 软 件 查询 的 缺陷 在 于 花费 的 时 间 太 多 。 菊 花 链 法 实际 上 是 一 种 硬件 查询 法 。 
所 有 的 IO 模块 共享 一 根 共 同 的 中 断 请 求 线 , 而 中 断 确认 信号 则 以 链 式 在 各 模块 间 相连 . 当 CPU 
检测 到 中 断 请 求 信号 时 ， 则 发 出 中 断 确 认 信号 。 中 断 确 认 信号 依次 在 IO 模块 间 传递 ， 直 到 发 
出 请 求 的 模块 ， 该 模块 则 把 它 的 ID 送 往 数据 线 由 CPU 读 取 。 

(4) 总 线 仲裁 法 。 一 个 1O 设备 在 发 出 中 断 请 求 之 前 ， 必 须 先 获得 总 线 控制 权 ， 所 以 可 由 
总 线 仲裁 机 制 来 裁定 谁 可 以 发 出 中 断 请 求 信号 。 当 CPU 发 出 中 断 响应 信号 后 , 该 设备 即 把 自己 
的 ID 发 往 数 据 线 。 

(5) 中 断 向 量 表 法 。 中 断 向 量 表 用 来 保存 各 个 中 断 源 的 中 断 服务 程序 的 入 口 地 址 。 当 外 设 
发 出 中 断 请 求 信号 (INTR) 以 后 ， 由 中 断 控 制 器 (INTC) 确定 其 中 断 号 ， 并 根据 中 断 号 查找 
中 断 向 量 表 来 取得 其 中 断 服 务 程序 的 入 口 地 址 ， 同 时 INTC 把 中 断 请 求 信号 提交 给 CPU， 如 图 
1-15 所 示 。 中 断 源 的 优先 级 由 INTC 来 控制 。 


(中 上 断 向 量 表 ) 
中 断 号 
外 设 1 iiG 地 址 1 
| 一 | 中断 服务 
外 设 n 一 一 INTR | 地 址 n 


图 1-15 中 断 向 量 表 法 


2) 中 断 优先 级 控制 

在 具有 多 个 中 断 源 的 计算 机 系统 中 ， 各 中 断 源 对 服务 的 要 求 紧 迫 程度 可 能 不 同 。 在 这 样 的 
计算 机 系统 中 ， 就 需要 按 中 断 源 的 轻重 缓急 来 安排 对 它们 的 服务 。 

在 中 断 优先 级 控制 系统 中 ， 给 最 紧迫 的 中 断 源 分 配 高 的 优先 级 ， 而 给 那些 要 求 相对 不 紧迫 
〈 例 如 几 百 微 秒 到 几 毫 秒 ) 的 中 断 源 分 配 低 一 些 的 优先 级 。 在 进行 优先 级 控制 时 解决 以 下 两 种 
情况 。 

(1) 当 不 同 优先 级 的 多 个 中 断 源 同 时 提出 中 断 请 求 时 ，CPU 应 优先 响应 优先 级 最 高 的 中 
断 源 。 

(2) 当 CPU 正在 对 某 一 个 中 断 源 服务 时 ， 又 有 比 它 优先 级 更 高 的 中 断 源 提出 中 断 请 求 ， 
CPU 应 能 暂时 中 断 正在 执行 的 中 断 服务 程序 而 转 去 对 优先 级 更 高 的 中 断 源 服务 , 服务 结束 后 再 
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本 到 原先 被 中 断 的 优先 级 较 低 的 中 断 服务 程序 继续 执行 ， 这 种 情况 称 为 中 断 嵌 套 ， 即 一 个 中 断 
服务 程序 中 隆 套 着 另 一 个 中 断 服务 程序 。 


4. 直接 存储 器 存 取 方式 


在 计算 机 与 外 设 交 换 数 据 的 过 程 中 ， 无论 是 无 条 件 传送 、 利 用 查询 方式 传送 还 是 利用 中 断 
方式 传送 ， 都 需要 由 CPU 通过 执行 程序 来 实现 ， 这 就 限制 了 数据 的 传送 速度 。 

直接 内 存 存 取 (Direct Memory Access，DMA) 是 指数 据 在 内 存 与 VO 设备 间 的 直接 成 块 
传送 ， 即 在 内 存 与 IO 设备 间 传 送 一 个 数据 块 的 过 程 中 , 不 需要 CPU 的 任何 干涉 ， 只 需要 CPU 
在 过 程 开 始 启动 〈 即 向 设备 发 出 “传送 一 块 数据 ”的 命令 ) 与 过 程 结束 CPU 通过 轮 询 或 中 断 
得 知 过 程 是 否 结束 和 下 次 操作 是 否 准备 就 绪 ) 时 的 处 理 , 实际 操作 由 DMA 硬件 直接 执行 完成 ， 
CPU 在 此 传送 过 程 中 可 做 别 的 事情 。 

DMA 传送 的 一 般 过 程 如 图 1-16 所 示 。 


内 存 
CPU 系统 , 
和 k Ti 系统 总 线 > 
HOLD 形成 | | 
HLDA 
1/O 接 口 报箱 和 
响应 | 人 人 | 
请 求 pa | 过 
外 设 
响应 


图 1-16 DMA 过 程 示意 图 


(1) 外 设 向 DMA 控制 器 (DMAC) 提出 DMA 传送 的 请 求 。 

(2) DMA 控制 器 向 CPU 提出 请 求 ， 其 请 求 信号 通常 加 到 CPU 的 保持 请 求 输入 端 HOLD 上 。 

(3) CPU 在 完成 当前 的 总 线 周 期 后 立即 对 此 请 求 作 出 响应 ，CPU 的 响应 包括 两 个 方面 的 
内 容 : 一 方面 ，CPU 将 有 效 的 保持 响应 信号 HLDA 输出 加 到 DMAC 上 ， 告 诉 DMAC 它 的 请 
求 已 得 到 响应 ， 另 一 方面 ，CPU 将 其 输出 的 总 线 信 号 置 为 高 阻 ， 这 就 意味 着 CPU 放弃 了 对 总 
线 的 控制 权 。 

(4) 此 时 ，DMAC 获得 了 对 系统 总 线 的 控制 权 ， 开 始 实施 对 系统 总 线 的 控制 。 同 时 向 提出 
请 求 的 外 设 送出 DMAC 的 响应 信号 ， 告 诉 外 设 其 请 求 已 得 到 响应 ， 现 在 准备 开始 进行 数据 的 
传送 。 
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(5) DMAC 送出 地 址 信号 和 控制 信号 ， 实 现 数 据 的 高 速 传送 。 

(6) 当 DMAC 将 规定 的 字 节 数 传送 完 时 ， 它 就 将 HOLD 信号 变 为 无 效 并 加 到 CPU 上 ， 撤 
销 对 CPU 的 请 求 。CPU 检测 到 无 效 的 HOLD 就 知道 DMAC 已 传送 结束 ，CPU 就 送出 无 效 的 
HLDA 响应 信号 ， 同 时 重新 获得 系统 总 线 的 控制 权 ， 接 着 DMA 前 的 总 线 周期 继续 执行 下 面 的 

在 此 再 强调 说 明 , 在 DMA 传送 过 程 中 无 须 CPU 的 干预 ,整个 系统 总 线 完 全 交 给 了 DMAC， 
由 它 控 制 系统 总 线 完成 数据 传送 。 在 DMA 传送 数据 时 要 占用 系统 总 线 ， 根 据 占 用 总 线 方法 的 
不 同 ，DMA 可 以 分 为 中 央 处 理 器 停止 法 、 总 线 周 期 分 时 法 和 总 线 周 期 挪用 法 等 。 无 论 采 用 哪 种 
方法 ， 在 DMA 传送 数据 期 间 ，CPU 不 能 使 用 总 线 。 


5. 输入 /输出 处 理 机 (IOP) 


DMA 方式 的 出 现 减轻 了 CPU 对 IO 操作 的 控制 , 使 得 CPU 的 效率 显著 提高 , 而 通道 的 出 
现 则 进一步 提高 了 CPU 的 效率 。 

通道 是 一 个 具有 特殊 功能 的 处 理 器 , 又 称 为 输入 输出 处 理 器 (Input/Output Processor, IOP )， 
它 分 担 了 CPU 的 一 部 分 功能 , 可 以 实现 对 外 围 设备 的 统一 管理 , 完成 外 围 设 备 与 主 存 之 间 的 数 
据 传送 。 

通道 方式 大 大 提高 了 CPU 的 工作 效率 ， 然 而 这 种 效率 的 提高 是 以 增加 更 多 的 硬件 为 代 
价 的 。 

外 围 处 理 机 (Peripheral Processor Unit，PPU ) 方式 是 通道 方式 的 进一步 发 展 。PPU 是 专用 
处 理 机 , 它 根据 主机 的 IO 命令 , 完成 对 外 设 数据 的 输入 输出 。 在 一 些 系统 中 , 设置 了 多 台 PPU， 
分 别 承 担 IO 控制 、 通 信 、 维 护 诊断 等 任务 。 从 某 种 意义 上 说 ， 这 种 系统 已 变 成 分 布 式 的 多 机 
系统 。 


1.2.4 总 线 结构 


所 谓 总 线 (Bus) ， 是 指 计算 机 设备 和 设备 之 问 传输 信息 的 公共 数据 通道 。 总 线 是 连接 计 
算 机 硬件 系统 内 多 种 设备 的 通信 线路 ， 它 的 一 个 重要 特征 是 由 总 线 上 的 所 有 设备 共享 ， 因 此 可 
以 将 计算 机 系统 内 的 多 种 设备 连接 到 总 线 上 。 


1. 总 线 的 分 类 
微机 中 的 总 线 分 为 数据 总 线 、 地 址 总 线 和 控制 总 线 3 类 。 不 同型 号 的 CPU 芯片 ， 其 数据 
总 线 、 地 址 总 线 和 控制 总 线 的 条 数 可 能 不 同 。 


数据 总 线 (Data Bus，DB) 用 来 传送 数据 信息 ， 是 双向 的 。CPU 既 可 通过 DB 从 内 存 或 
输入 设备 读 入 数据 ， 也 可 通过 DB 将 内 部 数据 送 至 内 存 或 输出 设备 。DB 的 宽度 决定 了 CPU 
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和 计算 机 其 他 设备 之 间 每 次 交换 数据 的 位 数 。 

地 址 总 线 (Address Bus，AB) 用 于 传送 CPU 发 出 的 地 址 信息 ， 是 单 向 的 。 传 送 地 址 信 
息 的 目的 是 指明 与 CPU 交换 信息 的 内 存单 元 或 IO 设备 。 存 储 器 是 按 地 址 访问 的 ， 所 以 每 个 
存储 单元 都 有 一 个 固定 地 址 ， 要 访问 1MB 存储 器 中 的 任 一 单元 ， 需 要 给 出 2^20 个 地 址 ， 即 
需要 20 位 地 址 〈2^20=1M) 。 因 此 ， 地 址 总 线 的 宽度 决定 了 CPU 的 最 大 寻 址 能 力 。 

控制 总 线 (Control Bus，CB) 用 来 传送 控制 信号 、 时 序 信号 和 状态 信息 等 。 其 中 有 的 信 
号 是 CPU 向 内 存 或 外 部 设备 发 出 的 信息 ， 有 的 是 内 存 或 外 部 设备 向 CPU 发 出 的 信息 。 显 然 ， 
CB 中 的 每 一 条 线 的 信息 传送 方向 是 单方 向 且 确 定 的 , 但 CB 作为 一 个 整体 则 是 双向 的 。 所 以 ， 
在 各 种 结构 框图 中 ， 凡 涉及 到 控制 总 线 CB， 均 是 以 双向 线 表示 。 

总 线 的 性 能 直接 影响 到 整 机 系统 的 性 能 ， 而 且 任何 系统 的 研制 和 外 围 模块 的 开发 都 必须 
依从 所 采用 的 总 线 规范 。 总 线 技术 随 着 微机 结构 的 改进 而 不 断 发 展 与 完善 。 


见 总 线 


(1) ISA 总 线 ,ISA 是 工业 标准 总 线 , 只 能 支持 16 位 的 VO 设备 ,数据 传输 率 大 约 是 16Mb/s， 
也 称 为 AT 标准 。 

(2) EISA 总 线 。EISA 是 在 ISA 总 线 的 基础 上 发 展 起 来 的 32 位 总 线 。 该 总 线 定 义 32 位 地 
址 线 .32 位 数据 线 以 及 其 他 控制 信号 线 、 电 源 线 、 地 线 等 共 196 个 接点 .总线 传输 速率 达 33Mb/s。 

(3) PCI 总 线 。PCI 总 线 是 目前 微型 机 上 广泛 采用 的 内 总 线 ， 采 用 并 行 传输 方式 。PCI 总 
线 有 适 于 32 位 机 的 124 个 信号 的 标准 和 适 于 64 位 机 的 188 个 信号 的 标准 。PCI 总 线 的 传输 速 
率 至 少 为 133Mb/s，64 位 PCI 总 线 的 传输 速率 为 266Mb/s。PCI 总 线 的 工作 与 CPU 的 工作 是 相 
互 独立 的 ， 也 就 是 说 ，PCI 总 线 时 钟 与 处 理 器 时 钟 是 独立 的 、 非 同步 的 。PCI 总 线 上 的 设备 是 
即 插 即 用 的 。 接 在 PCI 总 线 上 的 设备 均 可 以 提出 总 线 请 求 ， 通 过 PCI 管理 器 中 的 仲裁 机 构 允 许 
该 设备 成 为 主 控 设 备 ， 主 控 设 备 与 从 属 设备 间 可 以 进行 点 对 点 的 数据 传输 。PCI 总 线 能 够 对 所 
传输 的 地 址 和 数据 信号 进行 奇偶 校 验 检测 。 

(4) PCI Express 总 线 。PCI Express 简称 为 PCI-E， 采 用 点 对 点 串 行 连接 ， 每 个 设备 都 有 自 
己 的 专用 连接 ， 不 需要 向 整个 总 线 请 求 带宽 ， 而 且 可 以 把 数据 传输 率 提 高 到 一 个 很 高 的 频率 。 
相对 于 传统 PCI 总 线 在 单一 时 间 周 期 内 只 能 实现 单 向 传输 , PCI Express 的 双 单 工 连接 能 提供 更 
高 的 传输 速率 和 质量 。 

PCI Express 的 接口 根据 总 线 位 宽 不 同 而 有 所 差异 ， 包 括 X1、X4、X8 以 及 X16 (X2 模式 
将 用 于 内 部 接口 而 非 插 模 模式) ， 其 中 X1 的 传输 速度 为 230Mb/s， 而 X16 就 是 等 于 16 倍 于 
XI1 的 速度 ， 即 是 4Gb/s。 较 短 的 PCI Express 卡 可 以 插入 较 长 的 PCI Express 插 槽 中 使 用 。PCI 
Express 接口 能 够 支持 热 拔 插 。 同 时 ，PCI Express 总 线 支持 双向 传输 模式 ， 还 可 以 运行 全 双 工 
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模式 , 它 的 双 单 工 连接 能 提供 更 高 的 传输 速率 和 质量 , 它们 之 间 的 差异 与 半 双 工 和 全 双 工 类 似 。 
因此 连接 的 每 个 装置 都 可 以 使 用 最 大 带宽 。 

(5) 前 端 总 线 。 微 机 系统 中 ， 前 端 总 线 (Front Side Bus，FSB) 是 将 CPU 连接 到 北桥 芯片 
的 总 线 。 选 购 主板 和 CPU 时 ， 要 注意 两 者 的 搭配 问题 ， 一 般 来 说 ， 如 果 CPU 不 超频 ， 那 么 前 
端 总线 是 由 CPU 决定 的 ， 如 果 主 板 不 支持 CPU 所 需要 的 前 端 总 线 ， 系 统 就 无 法 工作 。 也 就 是 
说 ， 需 要 主板 和 CPU 都 支持 某 个 前 端 总 线 ， 系 统 才 能 工作 。 通 常情 况 下 ， 一 个 CPU 默认 的 前 
端 总 线 是 唯一 的 。 北 桥 芯 片 负责 联系 内 存 、 显 卡 等 数据 吞吐 量 最 大 的 部 件 ， 并 与 南 桥 芯片 连接 。 
CPU 通过 前 端 总 线 (FSB) 连接 到 北桥 芯片 ， 进 而 通过 北桥 芯片 与 内 存 、 显 卡 交换 数据 。FSB 
是 CPU 和 外 界 交换 数据 的 最 主要 通道 , 因此 FSB 的 数据 传输 能 力 对 计算 机 整体 性 能 作用 很 大 ， 
如 果 没 足够 快 的 FSB， 再 强 的 CPU 也 不 能 明显 提高 计算 机 整体 速度 。 

(6) RS-232C。RS-232C 是 一 条 串 行 外 总 线 ， 其 主要 特点 是 所 需 传输 线 比 较 少 ， 最 少 只 需 
三 条 线 (一 条 发 、 一 条 收 、 一 条 地 线 ) 即 可 实现 全 双 工 通信 。 传 送 距离 远 ， 用 电 平 传送 为 13m， 
电流 环 传送 可 达 千 米 。 有 多 种 可 供 选 择 的 传送 速率 。 采 用 非 归 零 码 负 风 辑 工 作 ， 电 平 <-3V 为 
逻辑 1， 而 电 平 >+3V 为 逻辑 0， 具有 较 好 的 抗 干 扰 性 。 

(7) SCSI 总 线 。 小 型 计算 机 系统 接口 (SCSI) 是 一 条 并 行 外 总 线 ， 广 泛 用 于 连接 软 硬 磁 
盘 、 光 盘 、 扫 描 仪 等 。 该 接口 总 线 早 期 是 8 位 的 , 后 来 发 展 到 16 位 。 传输 速率 由 SCSI-1 的 5Mb/s 
到 16 位 的 Ultra2 SCSI 的 80Mb/s。 今 天 的 传输 速率 已 高 达 320Mb/s。 该 总 线 上 最 多 可 接 63 种 
外 设 ， 传 输 距离 可 达 20m〔 差 分 传送 ) 。 

(8) SATA。SATA 是 Serial ATA 的 缩写 , 即 串 行 ATA。 它 主要 用 作 主 板 和 大 量 存储 设备 (如 
硬盘 及 光盘 驱动 器 ) 之 间 的 数据 传输 之 用 。SATA 总 线 使 用 嵌入 式 时 钟 信号 ， 具 备 了 更 强 的 纠 
潍 能 力 ， 与 以 往 相 比 其 最 大 的 区 别 在 于 能 对 传输 指令 〈 不 仅仅 是 数据 ) 进行 检查 ， 如 果 发 现 错 
误会 自动 校正 ， 这 在 很 大 程度 上 提高 了 数据 传输 的 可 靠 性 。 串 行 接口 还 具有 结构 简单 、 支 持 热 
插 拔 的 优点 。 

(9) USB。 通 用 串 行 总 线 (USB) 当前 风头 正 劲 ， 近 几 年 得 到 十 分 广泛 的 应 用 。USB 由 4 
条 信号 线 组 成 ， 其 中 两 条 用 于 传送 数据 ， 另 外 两 条 传送 +5V 容量 为 500mA 的 电源 。 可 以 经 过 
集线器 (Hub) 进行 树 状 连接 ， 最 多 可 达 5 层 。 该 总 线 上 可 接 127 个 设备 。USB 1.0 有 两 种 传送 
速率 :低速 为 1.5Mb/s， 高 速 为 12Mb/s。USB 2.0 的 传送 速率 为 480Mb/s。USB 总 线 最 大 的 优 
点 还 在 于 它 支持 即 插 即 用 ， 并 支持 热 插 拔 。 

(10) IEEE-1394。IEEE-1394 是 高 速 串 行 外 总 线 ， 近 几 年 得 到 广泛 应 用 。IEEE-1394 也 支 
持 外 设 热 插 拔 ， 可 为 外 设 提供 电源 ， 省 去 了 外 设 自 带 的 电源 ， 能 连接 多 个 不 同 设备 ， 支 持 同步 
和 异步 数据 传输 。 IEEE-1394 由 6 条 信号 线 组 成 ， 其 中 两 条 用 于 传送 数据 ， 两 条 传送 控制 信号 ， 
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另外 两 条 传送 8 一 40V 容量 为 1500mA 的 电源 ,IEEE-1394 总 线 理 论 上 可 接 63 个 设备 .IEEE-1394 
的 传送 速率 从 400Mb/s、800Mb/s、1600Mb/s 直到 3.2Gb/s。 

(11) IEEE-488 总 线 。IEEE-488 是 并 行 总 线 接口 标准 。 微 计算 机 、 数 字 电 压 表 、 数 码 显 
示 器 等 设备 及 其 他 仪器 仪表 均 可 用 IEFEE-488 总 线 连接 装配 , 它 按照 位 并 行 、 字 节 串 行 双向 异 
步 方式 传输 信号 ， 连 接 方 式 为 总 线 方式 ， 仪 器 设备 不 需 中 介 单 元 直接 并 联 于 总 线 上 。 总 线 上 
最 多 可 连接 15 台 设 备 。 最 大 传输 距离 为 20m， 信 号 传输 速度 一 般 为 500Kb/s， 最 大 传输 速度 
为 1Mb/s。 


1.3 安全 性 、 可 靠 性 与 系统 性 能 评测 基础 知识 


1.3.1 计算 机 安全 概述 


计算 机 安全 是 一 个 涵盖 非常 广 的 课题 ， 既 包括 硬件 、 软 件 和 技术 ， 又 包括 安全 规划 、 安 全 
管理 和 安全 监督 。 计 算 机 安全 可 包括 安全 管理 、 通 信 与 网 络 安全 、 密 码 学 、 安 全 体系 及 模型 、 
容错 与 容 灾 、 涉 及 安全 的 应 用 程序 及 系统 开发 、 法 律 、 犯 罪 及 道德 规范 等 领域 。 

其 中 安全 管理 是 非常 重要 的 , 作为 信息 系统 的 管理 部 门 应 根据 管理 原则 和 该 系统 处 理 数 据 
的 保密 性 ， 制 定 相应 的 管理 制度 或 规范 。 例 如 ， 根 据 工作 的 重要 程度 确定 系统 的 安全 等 级 ， 根 
据 确 定 的 安全 等 级 确定 安全 管理 的 范围 ， 制 定 相应 的 机 房管 理 制度 、 操 作 规程 、 系 统 维护 措施 
以 及 应 急 措施 等 。 

1. 计算 机 的 安全 等 级 


计算 机 系统 中 的 三 类 安全 性 是 指 技术 安全 性 、 管 理 安全 性 和 政策 法 律 安全 性 。 但 是 ， 一 个 
安全 产品 的 购买 者 如 何 知 道 产品 的 设计 是 否 符合 规范 ， 是 否 能 解决 计算 机 网 络 的 安全 问题 ， 不 
同 的 组 织 机 构 各 自制 定 了 一 套 安全 评估 准则 。 一 些 重要 的 安全 评估 准则 如 下 。 

(1) 美国 国防 部 和 国家 标准 局 推出 的 《可 信 计 算 机 系统 评估 准则 》 (TCSEC) 。 

(2) 加 拿 大 的 《可 信 计 算 机 产品 评估 准则 》 (CTCPEC) 。 

(3) 美国 制定 的 《联邦 〈 最 低 安全 要 求 ) 评估 准则 》 (FC) 。 

(4) 欧洲 英 、 法 、 德 、 荷 四 国 国防 部 门 信息 安全 机 构 联合 制定 的 《信息 技术 安全 评估 准则 》 
(ITSEC) ， 该 准则 事实 上 已 成 为 欧盟 各 国 使 用 的 共同 评估 标准 。 

(5) 美国 制定 的 《信息 技术 安全 通用 评估 准则 》 简称 CC 标准 ) ， 国 际 标准 组 织 (ISO) 
于 1996 年 批准 CC 标准 以 ISO/TEC 15408 一 1999 名 称 正 式 列 入 国际 标准 系列 。 

其 中 , 美国 国防 部 和 国家 标准 局 的 《可 信 计 算 机 系统 评测 标准 》TCSEC/TDI 将 系统 划分 为 
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4 组 7 个 等 级 ， 如 表 1-5 所 示 。 


表 1-5 安全 性 的 级 别 


组 安全 级 别 定义 


可 验证 安全 设计 。 提 供 B3 级 保护 ， 同 时 给 出 系统 的 形式 化 隐秘 通道 分 析 、 
非 形式 化 代码 一 致 性 验证 
安全 域 。 该 级 的 TCB 必须 满足 访问 监控 器 的 要 求 ， 提 供 系 统 恢复 过 程 


结构 化 安全 保护 。 建立 形 式 化 的 安全 策略 模型 ,并 对 系统 内 的 所 有 主体 和 客 
体 实施 自主 访问 和 强制 访问 控制 


1 Al 
B3 
5 B2 
Bl 
C2 
ei 
4 D 
2. 安全 威胁 


标记 安全 保护 。 对 系统 的 数据 加 以 标记 , 并 对 标记 的 主体 和 客体 实施 强制 存 
取 控 制 

受 控 访 问 控制 。 实际 上 是 安全 产品 的 最 低档 次 , 提供 受 控 的 存 取保 护 , 存 取 
控制 以 用 户 为 单位 

只 提供 了 非常 初级 的 自主 安全 保护 , 能 实现 对 用 户 和 数据 的 分 离 , 进行 自主 
存 取 控制 ， 数 据 的 保护 以 用 户 组 为 单位 

最 低级 别 ， 保 护 措施 很 小 ， 没 有 安全 功能 


随 着 信息 交换 的 激增 ， 安 全 威胁 所 造成 的 危害 越 来 越 被 受到 重视 ， 因 此 对 信息 保密 的 需求 
也 从 军事 、 政 治 和 外 交 等 领域 迅速 扩展 到 民用 和 商用 领域 。 所 谓 安全 威胁 ， 是 指 某 个 人 、 物 、 
事件 对 某 一 资源 的 机 密 性 、 完 整 性 、 可 用 性 或 合法 性 所 造成 的 危害 。 某 种 攻击 就 是 威胁 的 具体 
实现 。 安 全 威胁 分 为 两 类 :故意 (如 黑客 渗透 ) 和 偶然 (如 信息 发 往 错误 的 地 址 〉。 

典型 的 安全 威胁 举例 如 表 1-6 所 示 。 


表 1-6 典型 的 安全 威胁 


威胁 说 明 

授权 侵犯 为 某 一 特权 使 用 一 个 系统 的 人 却 将 该 系统 用 作 其 他 未 授权 的 目的 

拒绝 服务 对 信息 或 其 他 资源 的 合法 访问 被 无 条 件 地 拒绝 ， 或 推迟 与 时 间 密 切 相 关 的 操作 
窃听 信息 从 被 监视 的 通信 过 程 中 泄漏 出 去 

信息 泄露 信息 被 泄漏 或 暴露 给 某 个 未 授权 的 实体 

截获 /修改 某 一 通信 数据 项 在 传输 过 程 中 被 改变 、 删 除 或 替代 

假冒 一 个 实体 (人 或 系统 ) 假装 成 男 一 个 实体 

否认 参与 某 次 通信 交换 的 一 方 否认 曾 发 生 过 此 次 交换 

非法 使 资源 被 某 个 未 授权 的 人 或 者 未 授权 的 方式 使 用 

人 员 政 忽 一 个 授权 的 人 为 了 金钱 或 利益 ， 或 由 于 粗心 将 信息 泄露 给 未 授权 的 人 


完整 性 破坏 


通过 对 数据 进行 未 授权 的 创建 、 修 改 或 破坏 ， 使 数据 的 一 致 性 受到 损坏 
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续 表 
威胁 说 了 明 
媒体 清理 信息 被 从 废弃 的 或 打印 过 的 媒体 中 获得 
物理 入 侵 一 个 入 侵 者 通过 绕 过 物理 控制 而 获得 对 系统 的 访问 
资源 耗 尽 某 一 资源 〈 如 访问 端口 ) 被 故意 超 负荷 地 使 用 ， 导 致 其 他 用 户 的 服务 被 中 断 


3 影响 数据 安全 的 因素 


影响 数据 安全 的 因素 有 内 部 和 外 部 两 类 。 

(1) 内 部 因素 。 可 采用 多 种 技术 对 数据 加 密 ; 制定 数据 安全 规划 ; 建立 安全 存储 体系 ， 包 
括 容 量 、 容 错 数 据 保护 和 数据 备份 等 ， 建 立 事故 应 急 计 划 和 容 灾 措施 ， 重 视 安全 管理 ， 制 定数 
据 安全 管理 规范 。 

(2) 外 部 因素 。 可 将 数据 分 成 不 同 的 密级 ， 规 定 外 部 使 用 人 员 的 权限 ; 设置 身份 认证 、 密 
码 、 设 置 口令 、 设 置 指纹 和 声 纹 笔迹 等 多 种 认证 ;设置 防火 墙 ， 为 计算 机 建立 一 道 屏障 ， 防 止 
外 部 入 侵 破坏 数据 ; 建立 入 侵 检 测 、 审 计 和 追踪 ， 对 计算 机 进行 防卫 。 同 时 ， 也 包括 计算 机 物 
理 环 境 的 保障 、 防 辐射 、 防 水 和 防火 等 外 部 防 灾 措 施 。 


1.3.2 -加密 技 术 和 认证 技术 


1， 加 密 技术 


加 密 技术 是 最 常用 的 安全 保密 手段 ， 数 据 加 密 技术 的 关键 在 于 加 密 /解密 算法 和 密 钥 管理 。 
数据 加 密 的 基本 过 程 就 是 对 原来 为 明文 的 文件 或 数据 按 某 种 加 密 算法 进行 处 理 ， 使 其 成 为 不 可 
读 的 一 段 代码 ， 通 常 称 为 “ 密 文 ”。“ 密 文 ”只 能 在 输入 相应 的 密 钥 之 后 才能 显示 出 原来 的 内 
容 ， 通 过 这 样 的 途径 使 数据 不 被 窃取 。 

数据 加 密 和 数据 解密 是 一 对 逆 过 程 。 数 据 加 密 是 用 加 密 算法 E 和 加 密 密 钥 天 将 明文 P 变 
换 成 密 文 C， 记 为 


C=Ex(P) 
数据 解密 是 数据 加 密 的 逆 过 程 ， 解 密 算法 D 和 解密 密 钥 KK, 将 密 文 C 变换 成 明文 已 ， 记 为 
P=Dr,(C) 


在 安全 保密 中 ， 可 通过 适当 的 密 钥 加 密 技 术 和 管理 机 制 来 保证 网 络 信息 的 通信 安全 。 密 钥 
加 密 技术 的 密码 体制 分 为 对 称 密 钥 体制 和 非 对 称 密 钥 体制 两 种 。 相 应 地 ， 对 数据 加 密 的 技术 分 
为 两 类 ， 即 对 称 加 密 (私人 密 钥 加 密 〉 和 非 对 称 加 密 (公开 密 钥 加 密 〉。 
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1) 对 称 加 密 技术 

对 称 加 密 采 用 了 对 称 密码 编码 技术 ， 其 特点 是 文件 加 密 和 解密 使 用 相同 的 密 铀 ， 这 种 方法 
在 密码 学 中 称 为 对 称 加 密 算法 。 

常用 的 对 称 加 密 算法 有 如 下 几 种 。 

(1) 数据 加 密 标准 (Digital Encryption Standard，DES) 算法 。DES 主要 采用 替换 和 移 位 的 
方法 加 密 。 它 用 56 位 密 钥 对 64 位 二 进 制 数 据 块 进行 加 密 ， 每 次 加 密 可 对 64 位 的 输入 数据 进 
行 16 轮 编码 ， 经 一 系列 替换 和 移 位 后 ， 输 入 的 64 位 原始 数据 转换 成 完全 不 同 的 64 位 输出 数 
据 。DES 算法 运算 速度 快 ， 密 钥 生产 容易 ， 适 合 于 在 当前 大 多 数 计算 机 上 用 软件 方法 实现 ， 同 
时 也 适合 于 在 专用 芯片 上 实现 。 

(2) 三 重 DES (3DES， 或 称 TDEA) 。 在 DES 的 基础 上 采用 三 重 DES， 即 用 两 个 56 位 
的 密 钥 及 和 到， 发 送 方 用 态 加 密 , 配 解 密 ， 再 使 用 天 加密。 接收 方 则 使 用 KK 解密 ,Ks 加密， 
再 使 用 到 解密 ， 其 效果 相当 于 将 密 钥 长 度 加 倍 。 

(3) RC-5 (Rivest Cipher 5) 。RC-5 是 由 Ron Rivest( 公 钥 算 法 的 创始 人 之 一 ) 在 1994 年 
开发 出 来 的 。RC-5 是 在 RCF2040 中 定义 的 ，RSA 数据 安全 公司 的 很 多 产品 都 使 用 了 RC-5。 

(4) 国际 数据 加 密 算法 (Intemational Data Encryption Adleman，IDEA) 。IDEA 是 在 DES 
算法 的 基础 上 发 展 起 来 的 ， 类 似 于 三 重 DES。IDEA 的 密 钥 为 128 位 ， 这 么 长 的 密 钥 在 今后 若 
干 年 内 应 该 是 安全 的 。 类 似 于 DES，IDEA 算法 也 是 一 种 数据 块 加 密 算法 ， 它 设计 了 一 系列 加 
密 轮 次 , 每 轮 加 密 都 使 用 从 完整 的 加 密 密 钥 中 生成 的 一 个 子 密 钥 . IDEA 加 密 标准 由 PGP (Pretty 
Good Privacy) 系统 使 用 。 

(5) 高 级 加 密 标 准 (Advanced Encryption Standard，AES) 算法 。AES 算法 基于 排列 和 惫 
换 运 算 。 排 列 是 对 数据 重新 进行 安排 ， 置 换 是 将 一 个 数据 单元 替换 为 另 一 个 。AES 使 用 几 种 不 
同 的 方法 来 执行 排列 和 置换 运算 。 

AES 是 一 个 迭代 的 、 对 称 密 钥 分 组 的 密码 ， 它 可 以 使 用 128、192 和 256 位 密 钥 ， 并 且 用 
128 位 〈16 字 节 ) 分 组 加 密 和 解密 数据 。 

2) 非 对 称 加 密 技术 

与 对 称 加 密 算法 不 同 ， 非 对 称 加 密 算法 需要 两 个 密 钥 :公开 密 钥 (Publickey》 和 私有 密 钥 
(Privatekey) 。 公 开 密 钥 与 私有 密 钥 是 一 对 ， 如 果 用 公开 密 钥 对 数据 进行 加 密 ， 只 有 用 对 应 的 私 
有 密 钥 才能 解密 ; 如 果 用 私有 密 钥 对 数据 进行 加 密 ， 那 么 只 有 用 对 应 的 公开 密 钥 才能 解密 。 因 为 
加 密 和 解密 使 用 的 是 两 个 不 同 的 密 钥 ， 所 以 这 种 算法 称 为 非 对 称 加 密 算法 。 

非 对 称 加 密 有 两 个 不 同 的 体制 ， 如 图 1-17 所 示 。 
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B 的 公 钥 B 的 私 钥 A 的 私 钥 A 的 公 钥 
明文 | 密 文 | 明文 明文 密 文 明文 
一 | A 加 密 B 解 密 | 一 A 加 密 B 解 密 “| 一 一 
(a) 加 密 模型 《b) 认 证 模型 


图 1-17 非 对 称 加 密 体制 模型 


非 对 称 加 密 算法 实现 机 密 信息 交换 的 基本 过 程 是 : 甲 方 生成 一 对 密 钥 并 将 其 中 的 一 把 作为 
公用 密 钥 向 其 他 方 公开 ;得 到 该 公用 密 钥 的 乙方 使 用 该 密 钥 对 机 密 信息 进行 加 密 后 再 发 送 给 甲 
方 ， 甲 方 再 用 自己 保存 的 另 一 把 专用 密 钥 对 加 密 后 的 信息 进行 解密 。 甲 方 只 能 用 其 专用 密 钥 解 
密 由 其 公用 密 钥 加 密 后 的 任何 信息 。 

非 对 称 加 密 算法 的 保密 性 比较 好 ， 它 消除 了 最 终 用 户 交 换 密 钥 的 需要 ， 但 加 密 和 解密 花费 
的 时 间 长 、 速 度 慢 ， 不 适合 于 对 文件 加 密 ， 而 只 适用 于 对 少量 数据 进行 加 密 。 

RSA (Rivest，Shamir and Adleman) 算法 是 一 种 公 钥 加 密 算法 ， 它 按照 下 面 的 要 求 选择 公 

(1) 选择 两 个 大 素数 p 和 gq (大 于 10'%) 。 

(2) 令 n=pXg 和 ==(p-1)X(g-1)。 

(3) 选择 d 与 = 互 质 。 

(4) 选择 e,， 使 eXdq=1(mod z)。 

明文 了 被 分 成 位 的 块 ， 是 满足 2:<n 的 最 大 整数 ， 于 是 有 0 入 P<n。 加 密 时 计算 

C=P'(mod n) 
这 样 公 钥 为 em) 。 解 密 时 计算 

P=-Cemod7) 
即 私 钥 为 (qd,n) 。 

例如 ， 设 p=2，g=11,， n=33，==20，d=7，e=3，C=P3(mod 33)，P=C'(mod 33)， 则 有 

C=23(mod 33)=8(mod 33)=8 

P=8 "(mod 33)=2097152(mod 33)=2 

RSA 算法 的 安全 性 是 基于 大 素数 分 解 的 困难 性 。 攻 击 者 可 以 分 解 已 知 的 n， 得 到 p 和 gq， 
然后 可 得 到 =， 最 后 用 Euclid 算法 ， 由 e 和 sz 得 到 4。 但 是 要 分 解 200 位 的 数 ， 需 要 40 亿 年 ; 
分 解 500 位 的 数 ， 则 需要 10” 年 。 

3) 密 钥 管 理 

密 钥 是 有 生命 周期 的 ， 它 包括 密 钥 和 证 书 的 有 效 时 间 ， 以 及 已 撤销 密 钥 和 证 书 的 维护 时 间 
等 。 密 钥 既 然 要 求 保密 ， 这 就 涉及 密 钥 的 管理 问题 , 管理 不 好 ， 密 钥 同 样 可 能 被 无 意识 地 泄露 ， 
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并 不 是 有 了 密 钥 就 可 以 高 枕 无 忧 ， 任 何 保密 也 只 是 相对 的 ， 是 有 时 效 的 。 密 钥 管理 主要 是 指 密 
钥 对 的 安全 管理 ， 包 括 密 钥 产生 、 密 钥 备 份 、 密 钥 备份 和 恢复 、 密 钥 更 新 等 。 

(1) 密 钥 产生 。 密 钥 对 的 产生 是 证 书 申请 过 程 中 重要 的 一 步 ， 其 中 产生 的 私 钥 由 用 户 保留 ， 
公 钥 和 其 他 信息 则 交 给 CA 中 心 进行 签名 ， 从 而 产生 证 书 。 根 据 证 书 类 型 和 应 用 的 不 同 ， 密 钥 
对 的 产生 也 有 不 同 的 形式 和 方法 。 对 于 普通 证 书 和 测试 证 书 ， 一 般 由 浏览 器 或 固定 的 终端 应 用 
来 产生 ， 这 样 产生 的 密 钥 强度 较 小 ， 不 适合 应 用 于 比较 重要 的 安全 网 络 交易 。 而 对 于 比较 重要 
的 证 书 ， 如 商家 证 书 和 服务 器 证 书 等 ， 密 钥 对 一 般 由 专用 应 用 程序 或 CA 中 心 直 接 产生 ， 这 样 
产生 的 密 钥 强度 大 ， 适 合 于 重要 的 应 用 场合 。 

另外 ， 根 据 密 钥 的 应 用 不 同 ， 也 可 能 会 有 不 同 的 产生 方式 。 例 如 ， 签 名 密 钥 可 能 在 客户 端 
或 RA 注册 管理 机 构 》 中 心 产 生 ， 而 加 密 密 钥 则 需要 在 CA 中 心 直 接 产生 。 

(2) 密 钥 备 份 和 恢复 。 在 一 个 PKI (Public Key Infrastructure， 公 开 密 钥 体系 ) 系统 中 ， 维 
护 密 钥 对 的 备份 至 关 重 要 ,如 果 没有 这 种 措施 ， 当 密 钥 丢失 后 ,将 意味 着 加 密 数 据 的 完全 丢失 ， 
对 于 一 些 重要 数据 ， 这 将 是 灾难 性 的 。 所 以 ， 密 钥 的 备份 和 恢复 也 是 PKI 密 钥 管理 中 重要 的 一 
环 。 换 句 话说， 即使 密 钥 丢 失 ， 使 用 PKI 的 企业 和 组 织 必须 仍 能 够 得 到 确认 ， 受 密 钥 加 密 保护 
的 重要 信息 也 必须 能 够 恢复 。 当 然 ， 不 能 让 一 个 独立 的 个 人 完全 控制 最 重要 的 主 密 钥 ， 否 则 将 
引起 严重 后 果 。 

企业 级 的 PKI 产品 至 少 应 该 支持 用 于 加 密 的 安全 密 钥 的 存储 、 备 份 和 恢复 。 密 钥 一 般 用 口 
令 进 行 保护 ， 而 口令 丢失 则 是 管理 员 最 常见 的 安全 朴 漏 之 一 。 所 以 ，PKI 产品 应 该 能 够 备份 密 
钥 ， 即 使 口令 丢失 ， 它 也 能 够 让 用 户 在 一 定 条 件 下 恢复 该 密 钥 ， 并 设置 新 的 口令 。 

(3) 密 钥 更 新 。 如 果 用 户 可 以 一 次 又 一 次 地 使 用 同样 的 密 钥 与 别人 交换 信息 ， 那 么 密 钥 也 
同 其 他 任何 密码 一 样 存在 着 一 定 的 安全 性 ， 虽 然 说 用 户 的 私 钥 是 不 对 外 公开 的 ， 但 是 也 很 难保 
证 私 钥 长 期 的 保密 性 ， 很 难保 证 长 期 以 来 不 被 泄露 。 如 果 某 人 偶然 地 知道 了 用 户 的 密 铀 ， 那 么 
用 户 曾 经 和 另 一 个 人 交换 的 每 一 条 消息 都 不 再 是 保密 的 了 。 另 外 ， 使 用 一 个 特定 密 钥 加 密 的 信 
息 越 多 ， 提 供给 窃听 者 的 材料 也 就 越 多 ， 从 某 种 意义 上 来 讲 也 就 越 不 安全 了 。 

对 每 一 个 由 CA 颁发 的 证 书 都 会 有 有 效 期 ， 密 钥 对 生命 周期 的 长 短 由 签发 证 书 的 CA 中 心 
来 确定 ， 各 CA 系统 的 证 书 的 有 效 期 限 有 所 不 同 ， 一 般 为 2 一 3 年 。 当 用 户 的 私 钥 被 泄漏 或 证 书 
的 有 效 期 快 到 时 ， 用 户 应 该 更 新 私 钥 。 这 时 用 户 可 以 废除 证 书 ， 产 生 新 的 密 钥 对 ， 申 请 新 的 
证 书 。 

(4) 多 密 钥 的 管理 。 假 设 在 某 机 构 中 有 100 个 人 ， 如 果 他 们 任意 两 人 之 间 可 以 进行 秘密 对 
话 ， 那 么 总 共 需 要 多 少 密 钥 呢 ? 每 个 人 需要 知道 多 少 密 钥 呢 ? 如 果 任 何 两 个 人 之 间 要 不 同 的 密 
钥 ， 则 总 共 需 要 4950 个 密 钥 ， 而 且 每 个 人 应 记 住 99 个 密 钥 。 如 果 机 构 的 人 数 是 1000、10000 
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或 更 多 ， 这 种 办 法 显然 就 过 于 愚 春 了 ， 管 理 密 钥 将 是 一 件 非常 困难 的 事情 。 为 此 需要 研究 并 开 
发 用 于 创建 和 分 发 密 钥 的 加 密 安全 的 方法 。 

Kerberos 提供 了 一 种 解决 这 个 问题 的 较 好 的 方案 , 它 是 由 MIT 发 明 的 , 使 保密 密 钥 的 管理 
和 分 发 变 得 十 分 容易 ， 但 这 种 方法 本 身 还 存在 一 定 的 缺点 。 为 了 能 在 因特网 上 提供 一 个 实用 的 
解决 方案 ,Kerberos 建立 了 一 个 安全 的 、 可 信任 的 密 钥 分 发 中 心 (Key Distribution Center, KDC)， 
每 个 用 户 只 要 知道 一 个 和 “KDC 进行 会 话 的 密 钥 就 可 以 了 ， 而 不 需要 知道 成 百 上 千 个 不 同 的 
密 钥 。 


2. 认证 技术 


认证 技术 主要 解决 网 络 通 信 过 程 中 通信 双方 的 身份 认可 。 认 证 的 过 程 涉及 加 密 和 密 钥 交 
换 。 通 常 ， 加 密 可 使 用 对 称 加 密 、 不 对 称 加 密 及 两 种 加 密 方法 的 混合 方法 。 认 证 方 一 般 有 账户 
名 /口令 认证 、 使 用 摘要 算法 认证 和 基于 PKI 的 认证 。 

一 个 有 效 的 PKI 系统 必须 是 安全 的 和 透明 的 ,用 户 在 获得 加 密 和 数字 签名 服务 时 不 需要 详细 
地 了 解 PKI 的 内 部 运作 机 制 。 在 一 个 典型 、 完 整 和 有 效 的 PKI 系统 中 ,除了 具有 证 书 的 创建 和 发 
布 ， 特 别 是 证 书 的 撤销 功能 外 ， 一 个 可 用 的 PKI 产品 还 必须 提供 相应 的 密 钥 管 理 服务 ,包括 密 钥 
的 备份 、 恢 复 和 更 新 等 。 没 有 一 个 好 的 密 钥 管理 系统 ， 将 极 大 地 影响 一 个 PKI 系统 的 规模 、 可 伸 
缩 性 和 在 协同 网 络 中 的 运行 成 本 。 在 一 个 企业 中 ，PKI 系统 必须 有 能 力 为 一 个 用 户 管理 多 对 密 钥 
和 证 书 ， 能 够 提供 安全 策略 编辑 和 管理 工具 ， 如 密 钥 周期 和 密 钥 用 途 等 。 

PKI 是 一 种 遵循 既定 标准 的 密 钥 管理 平台 ， 能 够 为 所 有 网 络 应 用 提供 加 密 和 数字 签名 等 密 
码 服务 及 所 必需 的 密 钥 和 证 书 管理 体系 。 简 单 来 说 ，PKI 就 是 利用 公 钥 理论 和 技术 建立 的 提供 
安全 服务 的 基础 设施 。PKI 技术 是 信息 安全 技术 的 核心 , 也 是 电子 商务 的 关键 和 基础 技术 。PKI 
的 基础 技术 包括 加 密 、 数 字 签名 、 数 据 完整 性 机 制 、 数 字 信封 和 双重 数字 签名 等 。 完 整 的 PKI 
系统 必须 具有 权威 认证 机 构 〈CA) 、 数 字 证 书库 、 密 钥 备 份 及 恢复 系统 、 证 书 作 废 系统 、 应 用 
接口 (Application Programming Interface，API) 等 基本 构成 部 分 。 

(1) 认证 机 构 。 即 数字 证 书 的 申请 及 签发 机 关 ，CA 必须 具备 权威 性 的 特征 。 

(2) 数字 证 书库 。 用 于 存储 已 签发 的 数字 证 书 及 公 钥 ， 用 户 可 由 此 获得 所 需 的 其 他 用 户 的 
证 书 及 公 钥 。 

(3) 密 钥 备份 及 恢复 系统 。 如 果 用 户 丢 失 了 用 于 解密 数据 的 密 铀 ， 则 数据 将 无 法 被 解密 ， 
这 将 造成 合法 数据 丢失 。 为 了 避免 这 种 情况 ，PKI 提供 了 备份 与 恢复 密 钥 的 机 制 。 但 须 注意 ， 
密 钥 的 备份 与 恢复 必须 由 可 信 的 机 构 来 完成 。 并 且 ， 密 钥 备 份 与 恢复 只 能 针对 解密 密 钥 ， 签 名 
私 钥 为 确保 其 唯一 性 而 不 能 够 作 备份 。 

(4) 证 书 作废 系统 。 证 书 作废 处 理 系统 是 PKI 的 一 个 必 备 组 件 。 与 日 常生 活 中 的 各 种 身份 
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证 件 一 样 ， 证 书 在 有 效 期 以 内 也 可 能 需要 作废 ， 原 因 可 能 是 密 钥 介 质 丢 失 或 用 户 身份 变更 等 。 
为 实现 这 一 点 ，PKI 必须 提供 作废 证 书 的 一 系列 机 制 。 

(5) 应 用 接口 。PKI 的 价值 在 于 使 用 户 能 够 方便 地 使 用 加 密 、 数 字 签名 等 安全 服务 ， 因 此 
一 个 完整 的 PKI 必须 提供 良好 的 应 用 接口 系统 ， 使 得 各 种 各 样 的 应 用 能 够 以 安全 、 一 致 、 可 信 
的 方式 与 PKI 交互 ， 确 保安 全 网 络 环境 的 完整 性 和 易 用 性 。 

PKI 采用 证 书 进行 公 钥 管理 ， 通 过 第 三 方 的 可 信任 机 构 〈 认 证 中 心 ， 即 CA) 把 用 户 的 公 
钥 和 用 户 的 其 他 标识 信息 捆绑 在 一 起 ， 其 中 包括 用 户 名 和 电子 邮件 地 址 等 信息 ， 以 在 Intemet 
上 验证 用 户 的 身份 。PKI 把 公 钥 密码 和 对 称 密码 结合 起 来 ， 在 Intermet 上 实现 密 钥 的 自动 管理 ， 
保证 网 上 数据 的 安全 传输 。 

因此 ， 从 大 的 方面 来 说 ， 所 有 提供 公 钥 加 密 和 数字 签名 服务 的 系统 都 可 归结 为 PKI 系统 的 
一 部 分 ，PKI 的 主要 目的 是 通过 自动 管理 密 钥 和 证 书 为 用 户 建立 起 一 个 安全 的 网 络 运行 环境 ， 
使 用 户 可 以 在 多 种 应 用 环境 下 方便 地 使 用 加 密 和 数字 签名 技术 ， 从 而 保证 网 上 数据 的 机 密 性 、 
完整 性 和 有 效 性 。 数 据 的 机 密 性 是 指数 据 在 传输 过 程 中 不 能 被 非 授权 者 偷 看 ， 数 据 的 完整 性 是 
指数 据 在 传输 过 程 中 不 能 被 非法 算 改 ， 数 据 的 有 效 性 是 指数 据 不 能 被 否认 。 

PKI 发 展 的 一 个 重要 方面 就 是 标准 化 问题 ， 它 也 是 建立 互 操作 性 的 基础 。 目 前 ，PKI 标准 
化 主要 有 两 个 方面 :一 是 RSA 公司 的 公 钥 加 密 标准 (Public Key Cryptography Standards, PKCS)， 
它 定义 了 许多 基本 PKI 部 件 ， 包 括 数字 签名 和 证 书 请 求 格式 等 ， 二 是 由 Internet 工程 任务 组 
(Internet Engineering Task Force, IETF) 和 PKI 工作 组 (Public Key Infrastructure Working Group， 
PKIX) 所 定义 的 一 组 具有 互 操作 性 的 公 钥 基础 设施 协议 。 在 今后 很 长 的 一 段 时 间 内 ，PKCS 和 
PKIX 将 会 并 存 ， 大 部 分 的 PKI 产品 为 保持 兼容 性 ， 也 将 会 对 这 两 种 标准 进行 支持 。 

1) Hash 函数 与 信息 摘要 (Message Digest) 

Hash〔 哈 希 ) 函数 提供 了 这 样 一 种 计算 过 程 : 输入 一 个 长 度 不 固定 的 字符 串 ， 返 回 一 串 固 
定 长 度 的 字符 串 ， 又 称 Hash 值 。 单 向 Hash 函数 用 于 产生 信息 摘要 。Hash 函数 主要 可 以 解决 以 
下 两 个 问题 : 在 某 一 特定 的 时 间 内 ， 无 法 查找 经 Hash 操作 后 生成 特定 Hash 值 的 原 报 文 ; 也 无 
法 查找 两 个 经 Hash 操作 后 生成 相同 Hash 值 的 不 同 报 文 。 这 样 ， 在 数字 签名 中 就 可 以 解决 验证 
签名 和 用 户 身份 验证 、 不 可 抵赖 性 的 问题 。 

信息 摘要 简要 地 描述 了 一 份 较 长 的 信息 或 文件 , 它 可 以 被 看 作 一 份 长 文件 的 “数字 指纹 ”。 
信息 摘要 用 于 创建 数字 签名 ， 对 于 特定 的 文件 而 言 , 信息 摘要 是 唯一 的 。 信息 摘 要 可 以 被 公开 ， 
它 不 会 透露 相应 文件 的 任何 内 容 。MD5 (MD 表示 信息 摘要 ) 是 由 Ron Rivest 设计 的 专门 用 于 
加 密 处 理 的 并 被 广泛 使 用 的 Hash 函数 。MD5 以 512 位 分 组 来 处 理 输入 的 信息 ， 且 每 一 分 组 又 
被 划分 为 16 个 32 位 子 分 组 ， 经 过 了 一 系列 的 处 理 后 ， 算 法 的 输出 由 四 个 32 位 分 组 组 成 ， 将 
这 四 个 32 位 分 组 级 联 后 将 生成 一 个 128 位 散 列 值 。 
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MD35 算法 具有 以 下 特点 : 

(1) 压缩 性 : 任意 长 度 的 数据 ， 算 出 的 MD5 值 长 度 都 是 固定 的 。 

(2) 容易 计算 : 从 原 数据 计算 出 MD5 值 很 容易 。 

(3) 抗 修改 性 : 对 原 数据 进行 任何 改动 ， 即 使 只 修改 1 个 字 节 ， 所 得 到 的 MD5 值 都 有 很 
大 区 别 。 

(4) 强 抗 碰撞 : 已 知 原 数据 和 其 MD5 值 ， 想 找到 一 个 具有 相同 MD5 值 的 数据 〈 即 伪造 数 
据 ) 是 非常 困难 的 。 

2) 数字 签名 

数字 签名 主要 经 过 以 下 几 个 过 程 。 

(1) 信息 发 送 者 使 用 一 个 单 向 散 列 函 数 〈Hash 函数 ) 对 信息 生成 信息 摘要 。 

(2) 信息 发 送 者 使 用 自己 的 私 钥 签名 信息 摘要 。 

(3) 信息 发 送 者 把 信息 本 身 和 已 签名 的 信息 摘要 一 起 发 送出 去 。 

(4) 信息 接收 者 通过 使 用 与 信息 发 送 者 使 用 的 同一 个 单 向 散 列 函数 (Hash 函数 ) 对 接收 的 
信息 本 身 生成 新 的 信息 摘要 ， 再 使 用 信息 发 送 者 的 公 钥 对 信息 摘要 进行 验证 ， 以 确认 信息 发 送 
者 的 身份 和 信息 是 否 被 修改 过 。 

数字 加 密 主要 经 过 以 下 几 个 过 程 。 

(1) 当 信息 发 送 者 需要 发 送信 息 时 ， 首 先生 成 一 个 对 称 密 钥 ， 用 该 对 称 密 钥 加 密 要 发 送 的 
报 文 。 

(2) 信息 发 送 者 用 信息 接收 者 的 公 钥 加 密 上 述 对 称 密 钥 。 

(3) 信息 发 送 者 将 第 (1) 步 和 第 (2) 步 的 结果 结合 在 一 起 传 给 信息 接收 者 ， 称 为 数字 
信封 。 

(4) 信息 接收 者 使 用 自己 的 私 钥 解密 被 加 密 的 对 称 密 钥 ， 再 用 此 对 称 密 钥 解密 被 发 送 方 加 
密 的 密 文 ， 得 到 真正 的 原文 。 

数字 签名 和 数字 加 密 的 过 程 虽然 都 使 用 公开 密 钥 体 系 ， 但 实现 的 过 程 正 好 相反 ， 使 用 的 密 
钥 对 也 不 同 。 数 字 签 名 使 用 的 是 发 送 方 的 密 钥 对 ， 发 送 方 用 自己 的 私有 密 钥 进行 加 密 ， 接 收 方 
用 发 送 方 的 公开 密 钥 进行 解密 ， 这 是 一 个 一 对 多 的 关系 ， 任 何 拥有 发 送 方 公开 密 钥 的 人 都 可 以 
验证 数字 签名 的 正确 性 。 数 字 加 密 则 使 用 的 是 接收 方 的 密 钥 对 ， 这 是 多 对 一 的 关系 ， 任 何 知 道 
接收 方 公开 密 钥 的 人 都 可 以 向 接收 方 发 送 加 密 信 息 ， 只 有 唯一 拥有 接收 方 私 有 密 钥 的 人 才能 对 
信息 解密 。 另 外 ， 数 字 签 名 只 采用 了 非 对 称 密 钥 加 密 算法 ， 它 能 保证 发 送信 息 的 完整 性 、 身 份 
认证 和 不 可 否认 性 ; 而 数字 加 密 采用 了 对 称 密 钥 加 密 算法 和 非 对 称 密 钥 加 密 算法 相 结 合 的 方 
法 ， 它 能 保证 发 送信 息 的 保密 性 。 
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3) SSL 协议 

SSL (Secure Sockets Layer， 安 全 套 接 层 ) 协议 最 初 是 由 Netscape Communication 公司 设计 
开发 的 ， 主 要 用 于 提高 应 用 程序 之 间 数 据 的 安全 系数 。SSL 协议 的 整个 概念 可 以 被 总 结 为 : 一 
个 保证 任何 安装 了 安全 套 接 字 的 客户 和 服务 器 间 事 务 安全 的 协议 , 它 涉及 所 有 TC/P 应 用 程序 。 
SSL 协议 主要 提供 如 下 三 方面 的 服务 。 

(1) 用 户 和 服务 器 的 合法 性 认证 。 认 证 用 户 和 服务 器 的 合法 性 ， 使 得 它们 能 够 确信 数据 将 
被 发 送 到 正确 的 客户 端 和 服务 器 上 。 客 户 端 和 服务 器 都 有 各 自 的 识别 号 ， 这 些 识别 号 由 公开 密 
钥 进 行 编号 ， 为 了 验证 用 户 是 否 合法 ， 安 全 套 接 层 协 议 要 求 在 握手 交换 数据 时 进行 数字 认证 ， 
以 此 来 确保 用 户 的 合法 性 。 

(2) 加 密 数 据 以 隐藏 被 传送 的 数据 ,安全套 接 层 协 议 所 采用 的 加 密 技术 既 有 对 称 密 钥 技 术 ， 
也 有 公开 密 钥 技术 。 在 客户 端 与 服务 器 进行 数据 交换 之 前 ， 交 换 SSL 初始 握手 信息 ， 在 SSL 
握手 信息 中 采用 了 各 种 加 密 技术 对 其 加 密 ， 以 保证 其 机 密 性 和 数据 的 完整 性 ， 并 且 用 数字 证 书 
进行 鉴别 ， 这 样 就 可 以 防止 非法 用 户 进行 破译 。 

(3) 保护 数据 的 完整 性 。 安 全 套 接 层 协议 采用 Hash 函数 和 机 密 共 享 的 方法 来 提供 信息 的 
完整 性 服务 ， 建 立 客户 端 与 服务 器 之 间 的 安全 通道 ， 使 所 有 经 过 安全 套 接 层 协议 处 理 的 业务 在 
传输 过 程 中 能 全 部 完整 、 准 确 无 误 地 到 达 目 的 地 。 

安全 套 接 层 协议 是 一 个 保证 计算 机 通信 安全 的 协议 ， 对 通信 对 话 过 程 进行 安全 保护 ， 其 实 
现 过 程 主 要 经 过 如 下 几 个 阶段 。 

(1) 接 通 阶段 。 客 户 端 通过 网 络 向 服务 器 打招呼 ， 服 务 器 回应 。 

(2) 密码 交换 阶段 。 客 户 端 与 服务 器 之 间 交 换 双 方 认可 的 密码 ， 一 般 选 用 RSA 密码 算法 ， 
也 有 的 选用 Diffie-Hellmanf 和 Fortezza-KEA 密码 算法 。 

(3) 会 谈 密码 阶段 。 客 户 端 与 服务 器 间 产 生 彼 此 交谈 的 会 谈 密码 。 

(4) 检验 阶段 。 客 户 端 检验 服务 器 取得 的 密码 。 

(5) 客户 认证 阶段 。 服 务 器 验证 客户 端的 可 信 度 。 

(6) 结束 阶段 。 客 户 端 与 服务 器 之 间 相 互 交换 结束 的 信息 。 

当 上 述 动作 完成 之 后 ， 两 者 间 的 资料 传送 就 会 加 密 ， 另 外 一 方 收 到 资料 后 ， 再 将 编码 资料 
还 原 。 即 使 盗 窍 者 在 网 络 上 取得 编码 后 的 资料 ， 如 果 没 有 原先 编制 的 密码 算法 ， 也 不 能 获得 可 
读 的 有 用 资料 。 

发 送 时 ， 信 息 用 对 称 密 钥 加 密 ， 对 称 密 钥 用 非 对称 算 法 加 密 ， 再 把 两 个 包 绑 在 一 起 传送 过 
去 。 接 收 的 过 程 与 发 送 正好 相反 ， 先 打开 有 对 称 密 钥 的 加 密 包 ， 再 用 对 称 密 钥 解密 。 
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在 电子 商务 交易 过 程 中 , 由 于 有 银行 参与 , 按照 SSL 协议 , 客户 的 购买 信息 首先 发 往 商家 ， 
商家 再 将 信息 转发 银行 ， 银 行 验证 客户 信息 的 合法 性 后 ， 通 知 商家 付款 成 功 ， 商 家 再 通知 客户 
购买 成 功 ， 并 将 商品 寄 送 客户 。 

4) 数字 时 间 蕉 技术 

数字 时 间 惟 是 数字 签名 技术 的 一 种 变种 应 用 。 在 电子 商务 交易 文件 中 ， 时 间 是 十 分 重要 的 
信息 。 在 书面 合同 中 ， 文 件 签署 的 日 期 和 签名 一 样 均 是 十 分 重要 的 防止 文件 被 伪造 和 自 改 的 关 
键 性 内 容 。 数 字 时 间 戳 服务 (Digital Time Stamp Service，DTS) 是 网 上 电子 商务 安全 服务 项 目 
之 一 ， 能 提供 电子 文件 的 日 期 和 时 间 信 息 的 安全 保护 。 

时 间 截 是 一 个 经 加 密 后 形成 的 凭证 文档 ， 包 括 如 下 3 个 部 分 。 

(1) 需 加 时 间 惟 的 文件 的 摘要 (Digest)。 

(2) DTS 收 到 文件 的 日 期 和 时 间 。 

(3) DTS 的 数字 签名 。 

一 般 来 说 ， 时 间 戳 产生 的 过 程 为 : 用 户 首先 将 需要 加 时 间 戳 的 文件 用 Hash 编码 加 密 形 成 
摘要 ， 然 后 将 该 摘要 发 送 到 DTS，DTS 在 加 入 了 收 到 文件 摘要 的 日 期 和 时 间 信 息 后 再 对 该 文件 
加 密 〈 数 字 签 名 ) ， 然 后 送 回 用 户 。 

书面 签署 文件 的 时 间 是 由 签署 人 自己 写 上 的 ， 而 数字 时 间 蕉 则 是 由 认证 单位 DTS 来 加 入 
的 ， 以 DTS 收 到 文件 的 时 间 为 依据 。 


1.3.3 ”计算 机 可 靠 性 


1. 计算 机 可 靠 性 概述 


计算 机 系统 的 硬件 故障 通常 是 由 元 器 件 的 失效 引起 的 。 对 元 器 件 进行 寿命 试验 并 根据 实际 
资料 统计 得 知 ， 元 器 件 的 可 靠 性 可 分 成 3 个 阶段 ， 在 开始 阶段 ， 元 器 件 的 工作 处 于 不 稳定 期 ， 
失效 率 较 高 ; 在 第 二 阶段 ， 元 器 件 进入 正常 工作 期 ， 失 效率 最 低 ， 基 本 保持 常数 ; 在 第 三 阶段 ， 
元 器 件 开始 老化 ， 失 效率 又 重新 提高 ， 这 就 是 所 谓 的 “浴盆 曲线 ”。 因 此 ， 应 保证 在 计算 机 中 
使 用 的 元 器 件 处 于 第 二 阶段 。 在 第 一 阶段 应 对 元 器 件 进行 老化 筛选 ， 而 到 了 第 三 个 阶段 ， 则 淘 
汰 该 计算 机 。 

计算 机 系统 的 可 靠 性 是 指 从 它 开始 运行 (+=0 ) 到 某 时 刻 t 这 段 时 间 内 能 正常 运行 的 概率 ， 
用 RC) 表示 。 所 谓 失 效率 ， 是 指 单位 时 间 内 失效 的 元 件数 与 元 件 总 数 的 比例 ， 用 4 表示 ， 当 4 
为 常数 时 ， 可 靠 性 与 失效 率 的 关系 为 

RD) =e 天 
典型 的 失效 率 与 时 间 的 关系 曲线 如 图 1-18 所 示 。 
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初始 随机 ' 损 耗 


图 1-18 ”失效 率 特性 


两 次 故障 之 间 系 统 能 正常 工作 的 时 间 的 平均 值 称 为 平均 无 故障 时 间 (MTBF〉， 即 
MTBF=1/4 

通常 用 平均 修复 时 间 (MTRF) 来 表示 计算 机 的 可 维修 性 ， 即 计算 机 的 维修 效率 ， 指 从 故 
障 发 生 到 机 器 修复 平均 所 需要 的 时 间 。 计 算 机 的 可 用 性 是 指 计算 机 的 使 用 效率 ， 它 以 系统 在 执 
行 任务 的 任意 时 刻 能 正常 工作 的 概率 4 来 表示 ， 即 

MTBF 
MTBF + MTRF 

计算 机 的 RAS 是 指 用 可 靠 性 R、 可 用 性 4 和 可 维修 性 8 这 3 个 指标 衡量 一 个 计算 机 系统 。 
但 在 实际 应 用 中 ， 引 起 计算 机 故障 的 原因 除了 元 器 件 以 外 还 有 组 装 工艺 、 风 辑 设计 等 因素 。 因 
此 ， 不同 厂家 生产 的 兼容 机 即使 采用 相同 的 元 器 件 ， 其 可 靠 性 及 MTBF 也 可 能 相差 很 大 。 

2. 计算 机 可 靠 性 模型 


计算 机 系统 是 一 个 复杂 的 系统 ， 而 且 影响 其 可 靠 性 的 因素 非常 复杂 ， 很 难 直接 对 其 进行 可 
靠 性 分 析 。 但 通过 建立 适当 的 数学 模型 ， 把 大 系统 分 割 成 若干 子 系统 ， 可 以 简化 其 分 析 过 程 。 
常见 的 系统 可 靠 性 数学 模型 有 以 下 3 种 。 

(1) 串联 系统 。 假 设 一 个 系统 由 个子 系统 组 成 ， 当 且 仅 当 所 有 的 子 系统 都 能 正常 工作 时 
系统 才能 正常 工作 ， 这 种 系统 称 为 串联 系统 ， 如 图 1-19 所 示 。 


et | 
图 1-19 串联 系统 的 可 靠 性 模型 


设 系 统 中 各 个 子 系统 的 可 靠 性 分 别 用 已, 尺 ,… ,Ry 来 表示 ， 则 系统 的 可 靠 性 R 可 由 下 式 
求 得 。 


A= 


R= RR Ry 
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如 果 系 统 的 各 个 子 系统 的 失效 率 分 别 用 所, 力 ,…, 来 表示 ， 则 系统 的 失效 率 和 可 由 下 式 
4tht" thy 

【 例 1.7】 设计 算 机 系统 由 CPU、 存 储 器 、LO 三 部 分 组 成 ， 其 可 靠 性 分 别 为 0.95、0.90 

和 0.85， 求 计算 机 系统 的 可 靠 性 。 

解 : R=Ri* R,* Rs=0.95X0.90X0.85=0.73 | 

输入 | | 


E 


计算 机 系统 的 可 靠 性 为 0.73。 


(2) 并 联系 统 。 假 如 一 个 系统 由 N 个 子 系统 组 成 ， 只 “输出 


要 有 一 个 子 系统 正常 工作 , 系统 就 能 正常 工作 , 这 样 的 系统 | 
称 为 并 联系 统 ， 如 图 1-20 所 示 。 设 每 个 子 系统 的 可 靠 性 
分 别 以 妨 , 书 ,… ,Ry 表示 ， 整 个 系统 的 可 靠 性 可 由 下 式 
求 得 。 图 1-20 并 联系 统 的 可 靠 性 模型 
R=1-(1—R)Q-R).…(-R,) 
假如 所 有 子 系统 的 失效 率 均 为 4 ， 则 系统 的 失效 率 Ap 为 
1 

1¥1 
4 

在 并 联系 统 中 只 有 一 个 子 系统 是 真正 需要 的 ， 其 余 N 一 1 个 子 系统 称 为 元 余子 系统 ， 随 着 
宛 余子 系统 数量 的 增加 ， 系 统 的 平均 无 故障 时 间 也 增加 了 。 

【 例 1.8】 设 一 个 系统 由 3 个 相同 的 子 系统 构成 , 其 可 靠 性 为 0.9, 平均 无 故障 时 间 为 10 000 
小 时 ， 求 系统 的 可 靠 性 和 平均 无 故障 时 间 。 

解 : 玉 = 尼 = 及 =09 人 = 有 = 为 =1/10000=1X104 (小 时 ) 

系统 可 靠 性 R=1-(I-R) = 0.999 


1 
EE 


k= 


系统 平均 无 故障 时 间 为 
站 1 1 
i (小 时 ) 
(3) N 模 宛 余 系 统 。 N 模 宛 余 系统 由 六 个 | 


CN=2n+1) 相同 的 子 系统 和 一 个 表决 器 组 成 ， 表 

决 器 把 N 个 子 系统 中 占 多 数 相同 结果 的 输出 作为 。 输入 =| 2 (GD a 

系统 的 输出 ， 如 图 1-21 所 示 。 : 
在 个 子 系统 中 ， 只 要 有 n+1 个 或 n+1 个 以 —|» | 

上 的 子 系统 能 正常 工作 ， 系 统 就 能 正常 工作 ， 输 出 图 1-21 N 模 元 余 系统 
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正确 的 结果 。 假 设 表决 器 是 完全 可 靠 的， 每 个 子 系统 的 可 靠 性 为 RB ， 则 N 模 元 余 系统 的 可 千 
性 为 
ee 和 ji i [1 N-i 
R- 立 (让 xRa R) 


其 中 ， (未 从 个 元 中 到 ;个 元 素 的 组 全 娄 。 


提高 计算 机 的 可 靠 性 一 般 采 取 如 下 两 项 措施 。 

(1) 提高 元 器 件 质 量 ， 改 进 加 工 工艺 与 工艺 结构 ， 完 善 电 路 设计 。 

(2) 发 展 容错 技术 ， 使 得 在 计算 机 硬件 有 故障 的 情况 下 ， 计 算 机 仍 能 继续 运行 ， 得 出 正确 
的 结果 。 


1.3.4 ”计算 机 系统 的 性 能 评价 


无 论 是 生产 计算 机 的 厂商 还 是 使 用 计算 机 的 用 户 ， 都 需要 有 某 种 方法 来 衡量 计算 机 的 性 
能 ， 作 为 设计 、 生 产 、 购 买 和 使 用 的 依据 。 但 是 ， 由 于 计算 机 系统 是 一 个 极 复杂 的 系统 ， 其 体 
系 结构 、 组 成 和 实现 都 有 若干 种 策略 ， 而 且 其 应 用 领域 也 千差万别 ， 所 以 很 难 找到 统一 的 规则 
或 标准 去 评测 所 有 的 计算 机 。 


1. 性 能 评测 的 常用 方法 


(1) 时 钟 频率 。 计 算 机 的 时 钟 频 率 在 一 定 程度 上 反映 了 机 器 速度 ， 一 般 来 讲 ， 主 频 越 高 ， 
速度 越 快 。 但 是 ， 相 同 频率 、 不 同体 系 结构 的 机 器 ， 其 速度 可 能 会 相差 很 多 ， 因 此 还 需要 用 其 
他 方法 来 测定 机 器 性 能 。 

(2) 指令 执行 速度 。 在 计算 机 发 展 初期 ， 曾 用 加 法 指令 的 运算 速度 来 衡量 计算 机 的 速度 ， 
速度 是 计算 机 的 主要 性 能 指标 之 一 。 因 为 加 法 指令 的 运算 速度 大 体 上 可 反映 出 乘法 、 除 法 等 其 
他 算术 运算 的 速度 ， 而 且 逻 辑 运算 、 转 移 指令 等 简单 指令 的 执行 时 间 往 往 被 设计 成 与 加 法 指令 
相同 ， 因 此 加 法 指令 的 运算 速度 有 一 定 的 代表 性 。 当 时 表征 机 器 运算 速度 的 单位 是 KIPS (每 秒 
干 条 指令 ) ， 后 来 随 着 机 器 运算 速度 的 提高 ， 计 量 单位 发 展 到 MIPS (每 秒 百 万 条 指令 ) 。 

另 一 种 描述 计算 机 指令 执行 速度 的 指标 是 每 秒 钟 执 行 浮 点 数 的 百 万 次 操作 的 数量 
MFLOPS. 

(3) 等 效 指令 速度 法 。 随 着 计算 机 指令 系统 的 发 展 ， 指 令 的 种 类 大 大 增加 ， 用 单 种 指令 的 
MIPS 值 来 表征 机 器 的 运算 速度 的 局 限 性 日 益 暴 露 ， 因 此 出 现 了 吉普 森 (Gibson〉 混 合法 或 等 
效 指令 速度 法 等 改进 的 办 法 。 


国医 
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等 效 指令 速度 法 统计 各 类 指令 在 程序 中 所 占 的 比例 ， 并 进行 折算 。 设 某 类 指令 i 在 程序 中 
所 占 的 比例 为 w， 执 行 时 间 为 #4， 则 等 效 指令 的 执行 时 间 为 


= 六 全 XD 


其 中 ，n 为 指令 的 种 类 数 。 

(4) 数据 处 理 速 率 (Processing Data Rate，PDR) 法 。 因 为 在 不 同 程序 中 ， 各 类 指令 的 使 
用 频率 是 不 同 的， 所 以 固定 比例 方法 存在 着 很 大 的 局 限 性 ， 而 且 数 据 长 度 与 指令 功能 的 强 弱 对 
解 题 的 速度 影响 极 大 。 同 时 ， 这 种 方法 也 不 能 反映 现代 计算 机 中 高 速 缓冲 存储 器 、 流 水 线 和 交 
又 存储 等 结构 的 影响 。 具 有 这 种 结构 的 计算 机 的 性 能 不 仅 与 指令 的 执行 频率 有 关 ， 而 且 与 指令 
的 执行 顺序 与 地 址 分 布 有 关 。 

PDR 法 采用 计算 PDR 值 的 方法 来 衡量 机 器 性 能 ，PDR 值 越 大 ， 机 器 性 能 越 好 。PDR 与 每 
条 指令 和 每 个 操作 数 的 平均 位 数 以 及 每 条 指令 的 平均 运算 速度 有 关 ， 其 计算 方法 如 下 : 

PDR=L/R 

其 中 ，L=0.85G+0.15H +0.4J+0.15K ,R=0.85M +0.09N +0.06P 。 
式 中 : G 一 一 每 条 定点 指令 的 位 数 ; 

M 一 一 平均 定点 加 法 时 间 ; 
一 一 每 条 浮 点 指令 的 位 数 ; 
一 一 平均 浮 点 加 法 时 间 ; 
一 一 定点 操作 数 的 位 数 ; 
一 一 平均 浮 点 乘法 时 间 ; 

KK 一 一 浮 点 操作 数 的 位 数 。 

此 外 ， 还 做 了 如 下 规定 : G>20 位 ， 五 >30 位 ， 从 主 存 取 一 条 指令 的 时 间 等 于 取 一 个 字 的 
时 间 ; 指令 与 操作 数 存 放 在 主 存 ， 无 变 址 或 间 址 操作 ; 允许 有 并 行 或 先行 取 指令 功能 ， 此 时 选 
择 平均 取 指令 时 间 。PDR 值 主要 对 CPU 和 主 存储 器 的 速度 进行 度量 ， 但 不 适合 衡量 机 器 的 整 
体 速 度 ， 因 为 它 没有 涉及 Cache、 多 功能 部 件 等 技术 对 性 能 的 影响 。 

(5) 核心 程序 法 。 上 述 性 能 评价 方法 主要 是 针对 CPU 〈 有 时 包括 主 存 ) ， 它 没有 考虑 诸如 
IO 结构 、 操 作 系统 、 编 译 程序 的 效率 等 系统 性 能 的 影响 ， 因 此 难以 准确 评价 计算 机 的 实际 工 
作 能 力 。 

核心 程序 法 是 研究 较 多 的 一 种 方法 , 它 把 应 用 程序 中 用 得 最 频繁 的 那 部 分 核心 程序 作为 评 
价 计算 机 性 能 的 标准 程序 ， 在 不 同 的 机 器 上 运行 ， 测 得 其 执行 时 间 ， 作 为 各 类 机 器 性 能 评价 的 
依据 。 机 器 软 / 硬 件 结构 的 特点 能 在 核心 程序 中 得 到 反映 , 但 是 核心 程序 各 部 分 之 间 的 联系 较 小 。 


VY 
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由 于 程序 短 ， 所 以 访问 存储 器 的 局 部 性 特征 很 明显 ， 以 至 于 Cache 的 命中 率 比 一 般 程 序 高 。 
2. 基准 测试 程序 


基准 程序 法 (Benchmark) 是 目前 被 用 户 一 致 承认 的 测试 性 能 的 较 好 方法 ， 有 多 种 多 样 的 
基准 程序 ， 例 如 主要 测试 整数 性 能 的 基准 程序 、 测 试 浮 点 性 能 的 基准 程序 等 。 

(1) 整数 测试 程序 。 Dhrystone 是 一 个 综合 性 的 基准 测试 程序 , 它 是 为 了 测试 编译 器 及 CPU 
处 理 整 数 指令 和 控制 功能 的 有 效 性 ， 人 为 地 选择 一 些 “ 典 型 指令 ”综合 起 来 形成 的 测试 
程序 。 

Dhrystone 程序 测试 的 结果 由 每 秒 多 少 个 Dhrystones 来 表示 机 器 的 性 能 ， 这 个 数值 越 大 ， 
性 能 越 好 。VAX11/780 的 测试 结果 为 每 秒 1757Dhrystones。 为 便于 比较 ， 人 们 假设 1VAX MIPS 
二 每 秒 1757Dhrystones, 将 被 测 机 器 的 结果 除 以 1757, 就 得 到 被 测 机 器 相对 VAX11/780 的 MIPS 
值 。 有 些 厂家 在 宣布 机 器 性 能 时 就 用 Dhrystone MIPS 值 作为 机 器 的 MIPS 值 。 

不 过 不 同 的 厂家 在 测试 MIPS 值 时 ， 使 用 的 基准 程序 一 般 是 不 一 样 的 ， 因 此 不 同 厂 家 机 器 
的 MIPS 值 有 时 虽然 是 相同 的 ， 但 其 性 能 却 可 能 差别 很 大 ， 那 是 因为 各 厂家 在 设计 计算 机 时 针 
对 不 同 的 应 用 领域 ， 如 科学 和 工程 应 用 、 商 业 管理 应 用 、 图 形 处 理应 用 等 ， 而 采用 了 不 同 的 体 
系 结构 和 实现 方法 。 同 一 厂家 的 机 器 ， 采 用 相同 的 体系 结构 ， 用 相同 的 基准 程序 测试 ， 得 到 的 
MIPS 值 越 大 ， 一 般 说 明 机 器 速度 越 快 。 

(2) 浮 点 测试 程序 。 在 科学 计算 和 工程 应 用 领域 内 ， 浮 点 计算 工作 量 占 很 大 比例 ， 因 此 机 
器 的 浮 点 性 能 对 系统 的 应 用 有 很 大 的 影响 。 有 些 机 器 只 标 出 单个 浮 点 操作 性 能 ， 如 浮 点 加 法 、 
浮 点 乘法 时 间 ， 而 大 部 分 工作 站 则 标 出 用 Linpack 和 Whetstone 基准 程序 测 得 的 浮 点 性 能 。 
Linpack 主要 测试 向 量 性 能 和 高 速 缓存 性 能 。Whetstone 是 一 个 综合 性 测试 程序 ， 除 测试 浮 点 操 
作 外 ， 还 测试 整数 计算 和 功能 调用 等 性 能 。 

@ 理论 峰值 浮 点 速度 。 巨 型 机 和 小 巨型 机 在 说 明 书 中 经 常 给 出 “理论 峰值 速度 ”的 
MFLOPS 值 ， 它 不 是 机 器 实际 执行 程序 时 的 速度 ， 而 是 机 器 在 理论 上 最 大 能 完成 的 浮 点 处 理 速 
度 。 它 不 仅 与 处 理 机 时 钟 周期 有 关 ， 而 且 还 与 一 个 处 理 机 里 能 并 行 执行 操作 的 流水 线 功能 部 件 
数目 和 处 理 机 的 数目 有 关 。 多 个 CPU 机 器 的 峰值 速度 是 单个 CPU 的 峰值 速度 与 CPU 个 数 的 
乘积 。 

@ Linpack 基准 测试 程序 。Linpack 基准 程序 是 一 个 用 FORTRAN 语言 写成 的 子 程序 软件 
包 ， 称 为 基本 线性 代数 子 程序 包 ， 此 程序 完成 的 主要 操作 是 浮 点 加 法 和 浮 点 乘法 操作 。 在 测量 
计算 机 系统 的 Linpack 性 能 时 ， 让 机 器 运行 Linpack 程序 ， 测 量 运行 时 间 ， 将 结果 用 MFLOPS 
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表示 。 
当 解 n 阶 线性 代数 方程 组 时 ，n 越 大 ， 向 量化 程度 越 高 。 其 关系 如 表 1-7 所 示 。 


表 1-7 德 阵 的 向 量化 程度 


矩阵 规模 100X100 300X300 1000X 1000 
向 量化 百分比 80% 95% 98% 


向 量化 百分比 指 含 向 量 成 分 的 计算 量 占 整个 程序 计算 量 的 百分比 。 在 同一 台 机 器 中 ,向量 
化 程度 越 高 ， 机 器 的 运算 速度 越 快 ， 因 为 不 管 n 的 大 小 ， 求 解 方程 时 花 在 非 向 量 操作 上 的 时 间 
差不多 是 相等 的 。 

@@ Whetstone 基准 测试 程序 。Whetstone 是 用 FORTRAN 语言 编写 的 综合 性 测试 程序 ， 
主要 由 执行 浮 点 运算 、 整 数 算术 运算 、 功 能 调用 、 数 组 变 址 、 条 件 转移 和 超越 函数 的 程序 组 
成 。Whetstone 的 测试 结果 用 Kwips 表示 ，1Kwips 表示 机 器 每 秒 钟 能 执行 1000 条 Whetstone 
指令 。 

(3) SPEC 基准 程序 (SPEC Benchmark) 。SPEC (System Performance Evaluation Cooperation ) 
是 由 几 十 家 世界 知名 的 计算 机 厂商 所 支持 的 非 盘 利 的 合作 组 织 ， 旨 在 开发 共同 认可 的 标准 基准 
程序 ， 目 前 已 更 名 为 Standard Performance Evaluation Cooperation 。 


要 版 本 有 SPEC CPU89、SPEC CPU92、SPEC CPU95、SPEC CPU2000、SPEC CPU2006 等 ， 
SPEC CPU2006 包括 12 个 整数 基准 程序 集 (CINT2006) 和 17 个 浮 点 基准 程序 集 (CFP2006) 。 
CINT2006 包括 C 编译 程序 、 量 子 计算 机 仿真 、 下 象棋 程序 等 ，CFP2006 包括 有 限 元 模型 结构 
化 网 格 法 、 分 子 动力 学 质点 法 、 流 体 动力 学 稀疏 线性 代数 法 等 。 

为 了 简化 测试 结果 ，SPEC 决定 使 用 单一 的 数字 来 归纳 12 种 整数 基准 程序 。 具 体 方法 是 将 
被 测 计算 机 的 执行 时 间 标 准 化 ， 即 将 被 测 计算 机 的 执行 时 间 除 以 一 个 参考 处 理 器 的 执行 时 间 ， 
结果 称 为 SPECratio。SPECratio 值 越 大 ， 表 示 性 能 越 快 (因为 SPECratio 是 执行 时 间 的 倒数 ) 。 
CINT2006 或 CFP2006 的 综合 测试 结果 是 取 SPECratio 的 几何 平均 值 。 

SPEC 原来 主要 测试 CPU 性 能 ， 现 在 则 强调 开发 能 反映 真实 应 用 的 基准 测试 程序 集 ， 并 已 
推广 至 测试 高 性 能 计算 机 系统 、 网 络 服务 器 上 商业 应 用 服务 器 等 。 

(4) TPC 基准 程序 。TPC (Transaction Processing Council， 事 务 处 理 委员 会 ) 基准 程序 是 
由 TPC 开发 的 评价 计算 机 事务 处 理性 能 的 测试 程序 , 用 于 评测 计算 机 在 事务 处 理 、 数 据 库 处 理 、 
企业 管理 与 决策 支持 系统 等 方面 的 性 能 。 其 中 ，TPC-C 是 在 线 事务 处 理 (On-line Transaction 


第 1 章 计算 机 系统 知识 


Processing，OLIP) 的 基准 程序 ，TPC-D 是 决策 支持 的 基准 程序 。TPC-E 作为 大 型 企业 信息 服 
务 的 基准 程序 。 与 TPC-C 一 样 ，TPC-E 的 测试 结果 也 主要 有 两 个 指标 : 性 能 指标 (tpsE， 
transactions per secondE) 和 人 性价比 〈 美 元 /psE) 。 其 中 ， 前 者 是 指 系统 在 执行 多 种 交易 时 ， 每 
秒 钟 可 以 处 理 多 少 交 易 ， 其 指标 值 越 大 越 好 ; 后 者 则 是 指 系统 价格 与 前 一 指标 的 比值 ， 数 值 越 
小 越 好 。 

TPC 基准 测试 程序 在 商业 界 范围 内 建立 了 用 于 衡量 机 器 性 能 以 及 性 能 价格 比 的 标准 。 但 
是 ， 任 何 一 种 测试 程序 都 有 一 定 的 适用 范围 ，TPC 也 不 例外 。 
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程序 设计 语言 是 为 了 书写 计算 机 程序 而 人 为 设计 的 符号 语言 ， 用 于 对 计算 过 程 进行 描述 、 
组 织 和 推导 。 程序 设计 语言 的 广泛 使 用 始 于 1957 年 出 现 的 FORTRAN, 程序 设计 语言 的 发 展 是 
一 个 不 断 演化 的 过 程 ， 其 根本 的 推动 力 是 更 高 的 抽象 机 制 以 及 对 程序 设计 思想 的 更 好 支持 。 


2.1 程序 设计 语言 概述 


本 节 主 要 介绍 程序 设计 语言 的 基本 概念 、 基 本 成 分 和 一 些 有 代表 性 的 程序 设计 语言 。 
2.1.1 程序 设计 语言 的 基本 概念 


1， 低 级 语言 和 高 级 语言 


计算 机 硬件 只 能 识别 由 0、1 组 成 的 机 器 指令 序列 ， 即 机 器 指令 程序 ， 因 此 机 器 指令 是 最 
基本 的 计算 机 语言 。 由 于 机 器 指令 是 特定 的 计算 机 系统 所 固有 的 、 面 向 机 器 的 语言 ， 所 以 用 机 
器 语言 进行 程序 设计 时 效率 很 低 ， 程 序 的 可 读 性 很 差 ， 也 难以 修改 和 维护 。 因 此 ， 人 们 就 用 容 
易 记忆 的 符号 代替 0、1 序列 来 表示 机 器 指令 ,例如 ， 用 ADD 表示 加 法 、 用 SUB 表示 减法 等 。 
用 符号 表示 的 指令 称 为 汇编 指令 ， 汇 编 指 令 的 集合 被 称 为 汇编 语言 。 汇 编 语 言 与 机 器 语言 十 分 
接近 ， 其 书写 格式 在 很 大 程度 上 取决 于 特定 计算 机 的 机 器 指令 ， 因 此 它 仍然 是 一 种 面向 机 器 的 
语言 ， 人 们 称 机 器 语言 和 汇编 语言 为 低级 语言 。 在 此 基础 上 ， 人 们 开发 了 功能 更 强 、 抽 象 级 别 
更 高 的 语言 以 支持 程序 设计 ， 于 是 就 产生 了 面向 各 类 应 用 的 程序 设计 语言 ， 称 为 高 级 语言 。 常 
见 的 有 Java、C、C++、PHP、Python、Delphi、PASCAL 等 。 这 类 语言 与 人 们 使 用 的 自然 语言 
比较 接近 ， 提 高 了 程序 设计 的 效率 。 

2. 编译 程序 和 解释 程序 

计算 机 只 能 理解 由 0、1 序列 构成 的 机 器 语言 ， 因 此 高 级 程序 设计 语言 需要 翻译 ， 担 负 这 一 任务 
的 程序 称 为 “语言 处 理 程序 ”语言 之 间 的 翻译 形式 有 多 种 ， 基 本 方式 为 汇编 、 解 释 和 编译 。 

用 某 种 高 级 语言 或 汇编 语言 编写 的 程序 称 为 源 程序 ， 源 程序 不 能 直接 在 计算 机 上 执行 。 如 
果 源 程序 是 用 汇编 语言 编写 的 ， 则 需要 一 个 汇编 程序 将 其 翻译 成 目标 程序 后 才能 执行 。 如 果 源 


第 2 章 程序 设计 语言 基础 知识 


程序 是 用 某 种 高 级 语言 编写 的 ， 则 需要 对 应 的 解释 程序 或 编译 程序 对 其 进行 翻译 ， 然 后 在 机 器 
上 运行 。 

解释 程序 也 称 为 解释 器 ， 它 或 者 直接 解释 执行 源 程序 ， 或 者 将 源 程序 翻译 成 某 种 中 间 代 码 
后 再 加 以 执行 ， 而 编译 程序 编译 器 〉 则 是 将 源 程 序 翻译 成 目标 语言 程序 ， 然 后 在 计算 机 上 运 
行 目 标 程序 。 这 两 种 语言 处 理 程序 的 根本 区 别 是 ， 在 编译 方式 下 ， 机 器 上 运行 的 是 与 源 程序 等 
价 的 目标 程序 ， 源 程序 和 编译 程序 都 不 再 参与 目标 程序 的 执行 过 程 ， 而 在 解释 方式 下 ， 解 释 程 
序 和 源 程序 (或 其 某 种 等 价 表示 ) 要 参与 到 程序 的 运行 过 程 中 , 运行 程序 的 控制 权 在 解释 程序 。 
简单 来 说 ， 在 解释 方式 下 ， 翻 译 源 程序 时 不 生成 独立 的 目标 程序 ， 而 编译 器 则 将 源 程序 翻译 成 
独立 保存 的 目标 程序 。 


3. 程序 设计 语言 的 定义 


一 般 地 ， 程 序 设计 语言 的 定义 都 涉及 语法 、 语 义 和 语 用 等 方面 。 

语法 是 指 由 程序 设计 语言 的 基本 符号 组 成 程序 中 的 各 个 语法 成 分 (包括 程序 ) 的 一 组 规则 ， 
其 中 由 基本 字符 构成 的 符号 (单词 ) 书写 规则 称 为 词法 规则 ， 由 符号 构成 语法 成 分 的 规则 称 为 
语法 规则 。 程 序 设计 语言 的 语法 可 用 形式 语言 进行 描述 。 

语义 是 程序 设计 语言 中 按 语 法 规则 构成 的 各 个 语法 成 分 的 含义 ,可 分 为 静态 语义 和 动态 语 
义 。 静 态 语义 指 编译 时 可 以 确定 的 语法 成 分 的 含义 ， 而 运行 时 刻 才能 确定 的 含义 是 动态 语义 。 
一 个 程序 的 执行 效果 说 明了 该 程序 的 语义 ， 它 取决 于 构成 程序 的 各 个 组 成 部 分 的 语义 。 

语 用 表示 了 构成 语言 的 各 个 记号 和 使 用 者 的 关系 ， 涉 及 符号 的 来 源 、 使 用 和 影响 。 

语言 的 实现 则 有 个 语 境 问 题 。 语 境 是 指 理解 和 实现 程序 设计 语言 的 环境 ， 包 括 编译 环境 和 
运行 环境 。 

4. 程序 设计 语言 的 分 类 


程序 设计 语言 有 交流 算法 和 计算 机 实现 的 双重 目的 ， 现 在 的 程序 设计 语言 种 类 繁多 ， 它 们 
在 应 用 上 各 有 不 同 的 侧重 面 。 若 一 种 程序 设计 语言 不 依赖 于 机 器 硬件 ， 则 称 为 高 级 语言 ， 若 程 
序 设计 语言 能 够 应 用 于 范围 广泛 的 问题 求解 过 程 中 ， 则 称 为 通用 的 程序 设计 语言 。 

1) 程序 设计 语言 发 展 概述 

各 种 程序 语言 都 在 不 断 地 发 展 之 中 ， 许 多 新 的 语言 也 相继 出 现 ， 各 种 开发 工具 在 组 件 化 和 
可 视 化 方面 进展 迅速 。 

Fortran (Formula Translation) 是 第 一 个 被 广泛 用 来 进行 科学 和 工程 计算 的 高 级 语言 。 一 个 
Fortran 程序 由 一 个 主 程序 和 若干 个 子 程序 组 成 。 主 程序 及 每 一 个 子 程序 都 是 独立 的 程序 单位 ， 
称 为 一 个 程序 模块 。 该 语言 自 诞生 以 来 广泛 地 应 用 于 数值 计算 领域 ， 积 累 了 大 量 高 效 而 可 靠 的 
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源 程序 。Fortran 语言 的 最 大 特性 是 接近 数学 公式 的 自然 描述 ， 具 有 很 高 的 执行 效率 ， 目 前 广泛 
地 应 用 于 并 行 计算 和 高 性 能 计算 领域 。 

ALGOL (ALGOrithmic Language) 诞生 于 晶体 管 计算 机 流行 的 年 代 ，Algol 60 是 程序 设计 
语言 发 展 史上 的 一 个 里 程 碑 ， 主 导 了 20 世纪 60 年 代 程序 语言 的 发 展 ， 并 为 后 来 软件 自动 化 及 
软件 可 靠 性 的 发 展商 定 了 基础 。ALGOL60 有 严格 的 公式 化 说 明 ， 即 采用 巴 科斯 范式 BNF 来 描 
述 语言 的 语法 。Algol 60 引进 了 许多 新 的 概念 ， 如 局 部 性 概念 、 动 态 、 递 归 等 。 

PASCAL 是 一 种 过 程式 、 结 构 化 程序 设计 语言 ， 由 瑞士 苏黎世 联邦 工业 大 学 的 沃 斯 
(N.Wirth) 教授 设计 ， 于 1970 年 发 表 。 该 语言 是 从 ALGOL60 衍生 的 , 但 功能 更 强 且 容易 使 用 。 
PASCAL 语言 曾经 在 高 校 计算 机 软件 教学 中 一 直 处 于 主导 地 位 ， 其 集成 开发 工具 Turbo Pascal 
曾经 非常 流行 。1985 年 发 布 了 Object Pascal。 

C 语言 是 20 世纪 70 年 代 初 发 展 起 来 的 一 种 通用 程序 设计 语言 ，UNIX 操作 系统 及 其 上 的 
许多 软件 都 是 用 C 编写 的 。 它 兼顾 了 高 级 语言 和 汇编 语言 的 特点 ， 提 供 了 一 个 丰富 的 运算 符 集 
合 以 及 比较 紧凑 的 语句 格式 。 由 于 C 提供 了 高 效 的 执行 语句 并 且 人 允许 程序 员 直 接 访问 操作 系统 
和 底层 硬件 ， 因 此 在 系统 级 应 用 和 实时 处 理应 用 开发 中 成 为 主要 语言 。 

C++ 是 在 C 语言 的 基础 上 于 20 世纪 80 年 代 发 展 起 来 的 , 与 C 兼容 , 但 是 比 C 多 了 封装 和 
抽象 ， 增 加 的 类 机 制 使 C++ 成 为 一 种 面向 对 象 的 程序 设计 语言 。 

C# (C Sharp) 是 由 Microsoft 公司 所 开发 的 一 种 面向 对 象 的 、 运 行 于 .NET Framework 的 高 
级 程序 设计 语言 ， 相 对 于 C++， 这 个 语言 在 许多 方面 进行 了 限制 和 增强 。 

Objective-C 是 根据 C 语言 所 衍生 出 来 的 语言 ， 继 承 了 C 语言 的 特性 ， 是 扩充 C 的 面向 对 
象 编 程 语言 ， 其 与 流行 的 编程 语言 风格 差异 较 大 。 由 于 GCC (GNU Compiler Collection，GNU 
编译 器 套装 ) 含 Objective-C 的 编译 器 ， 因 此 可 以 在 gcc 运 作 的 系统 中 编写 和 编译 。 该 语言 主要 
由 Apple 公司 维护 ， 是 MAC 系统 下 的 主要 开发 语言 。 与 C# 类 似 ，Objective-C 仅 支 持 单一 父 类 
继承 ， 不 支持 多 重 继承 。 

Java 产生 于 20 世纪 90 年 代 ， 其 初始 用 途 是 开发 网 络 浏览 器 的 小 应 用 程序 ， 但 是 作为 一 种 
通用 的 程序 设计 语言 ，Java 得 到 非常 广泛 的 应 用 。Java 保留 了 C++ 的 基本 语法 、 类 和 继承 等 概 
念 ， 删 掉 了 C++ 中 一 些 不 好 的 特征 ， 因 此 与 C++ 相 比 ，Java 更 简单 ， 其 语法 和 语义 更 合理 。 

Ruby 是 松本 行 弘 (Yakihiro Matsumoto， 常 称 为 Matz) 大 约 在 1993 年 设计 的 一 种 解释 性 、 
面向 对 象 、 动 态 类 型 的 脚本 语言 。 在 Ruby 语言 中 ， 任 何 东西 都 是 对 象 ， 包 括 其 他 语言 中 的 基 
本 数据 类 型 ， 比 如 整数 ， 每 个 过 程 或 函数 都 是 方法 ， 变 量 没有 类 型 ， 任 何 东 西 都 有 值 〈 不 管 是 
数学 或 者 逻辑 表达 式 还 是 一 个 语句 ， 都 会 有 值 ) 等 等 。 

PHP (Hypertext Preprocessor) 是 一 种 在 服务 器 端 执 行 的 、 嵌 入 HTML 文档 的 脚本 语言 ， 
其 语言 风格 类 似 于 C 语言 ， 由 网 站 编程 人 员 广 泛 运用 。PHP 可 以 快速 地 执行 动态 网 页 ， 其 语法 
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混合 了 C、Java、Perl 以 及 PHP 自 创 的 语法 。 由 于 在 服务 器 端 执行 ，PHP 能 充分 利用 服务 器 的 
性 能 。 另 外 ，PHP 支持 几乎 所 有 流行 的 数据 库 以 及 操作 系统 。 

了 Python 是 一 种 面向 对 象 的 解释 型 程序 设计 语言 ， 可 以 用 于 编写 独立 程序 、 快 速 脚本 和 复杂 
应 用 的 原型 。Python 也 是 一 种 脚本 语言 ， 它 支持 对 操作 系统 的 底层 访问 ， 也 可 以 将 Python 源 程 
序 翻译 成 字 节 码 在 Python 虚拟 机 上 运行 。 虽然 Python 的 内 核 很 小 ， 但 它 提 供 了 丰富 的 基本 构 
建 块 ， 还 可 以 用 C、C++ 和 Java 等 进行 扩展 ， 因 此 可 以 用 它 开 发 任何 类 型 的 程序 。 

JavaScript 是 一 种 脚本 语言 ， 被 广泛 用 于 Web 应 用 开发 ， 常 用 来 为 网 页 添加 各 式 各 样 的 动 
态 功 能 ， 为 用 户 提供 更 流畅 美观 的 浏览 效果 。 通 常 ， 将 JavaScript 脚本 嵌入 在 HTML 中 来 实现 
自身 的 功能 。 

Delphi 是 一 种 可 视 化 开发 工具 ,在 Windows 环境 下 使 用 ,其 在 Linux 上 的 对 应 产品 是 Kylix， 
其 主要 特性 为 基于 窗 体 和 面向 对 象 的 方法 、 高 速 的 编译 器 、 强 大 的 数据 库 支持 、 与 Windows 
编程 紧密 结合 以 及 成 熟 的 组 件 技术 。 它 采用 面向 对 象 的 编程 语言 Object Pascal 和 基于 构件 的 开 
发 结构 框架 。 

Visual Basic.NET 是 基于 微软 .NET Framework 的 面向 对 象 的 编程 语言 。 用 .NET 语言 (包括 
VB.NET) 开发 的 程序 源 代码 不 是 编译 成 能 够 直接 在 操作 系统 上 执行 的 二 进 制 本 地 代码 ， 而 是 
被 编译 成 为 中 间 代 码 MSIL (Microsoft Intermediate Language)， 然 后 通过 .NET Framework 的 通 
用 语言 运行 时 (CLR) 来 执行 。 程 序 执行 时 ，.NET Framework 将 中 间 代 码 翻 译 成 为 二 进 制 机 器 
码 后 ， 使 它 得 以 运行 。 因此， 如 果 计 算 机 上 没有 安装 .NET Framework， 这 些 程 序 将 不 能 够 被 
执行 。 

各 种 程序 设计 语言 都 在 不 断 地 发 展 之 中 ， 也 出 现 了 许多 新 的 语言 ， 开 发 工具 在 组 件 化 和 可 
视 化 方面 进展 迅速 。 

2) 程序 设计 语言 分 类 

程序 语言 的 分 类 没有 统一 的 标准 , 这 里 根据 设计 程序 的 方法 将 程序 语言 大 致 分 为 命令 式 和 
结构 化 程序 设计 语言 、 面 向 对 象 的 程序 设计 语言 、 函 数 式 程序 设计 语言 和 逻辑 型 程序 设计 语言 
等 范 型 。 

(1) 命令 式 和 结构 化 程序 设计 语言 。 命 令 式 语言 是 基于 动作 的 语言 ， 在 这 种 语言 中 ， 计 算 
被 看 成 是 动作 的 序列 。 命令 式 语言 族 开 始 于 Fortran, PASCAL 和 C 语言 都 可 以 体现 命令 式 程序 
设计 的 关键 思想 。 

通常 所 称 的 结构 化 程序 设计 语言 属于 命令 式 语 言 类 ， 其 结构 特性 主要 反映 在 以 下 几 个 方 
面 : 一 是 用 自 项 向 下 逐步 精 化 的 方法 编程 ， 二 是 按 模 块 组 织 的 方法 编程 ,三 是 程序 只 包含 顺序 、 
判定 分支 ) 及 循环 构造 ， 而 且 每 种 构造 只 允许 单 入 口 和 单 出 口 。 结 构 化 程序 的 结构 简单 清晰 、 
模块 化 强 ， 描 述 方式 接近 人 们 习惯 的 推理 式 思维 方式 ， 因 此 可 读 性 强 ， 在 软件 重用 性 、 软 件 维 
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护 等 方面 都 有 所 进步 ， 在 大 型 软件 开发 中 曾 发 挥 过 重要 的 作用 。 目 前 仍 有 许多 应 用 程序 的 开发 
采用 结构 化 程序 设计 技术 和 方法 。C、PASCAL 等 都 是 典型 的 结构 化 程序 设计 语言 。 

(2) 面向 对 象 的 程序 设计 语言 。 程序 设 计 语言 的 演化 从 最 开始 的 机 器 语言 到 汇编 语言 到 各 
种 结构 化 高 级 语言 ， 最 后 到 支持 面向 对 象 技术 的 面向 对 象 语言 ， 反 映 的 就 是 一 条 抽象 机 制 不 断 
提高 的 演化 道路 。 

面向 对 象 的 程序 设计 在 很 大 程度 上 应 归功 于 从 模拟 领域 发 展 起 来 的 Simula, 其 提出 了 对 象 
和 类 的 概念 。C++、Java 和 Smalltalk 是 面向 对 象 程序 设计 语言 的 代表 ， 它 们 都 必须 支持 新 的 程 
序 设 计 技 术 ， 如 数据 隐藏 、 数 据 抽象 、 用 户 定义 类 型 、 继 承 和 多 态 等 。 

(3) 函数 式 程序 设计 语言 。 函 数 式 语 言 是 一 类 以 入 -演算 为 基础 的 语言 ， 其 基本 概念 来 自 于 
LISP， 这 是 一 个 在 1958 年 为 了 人 工 智能 应 用 而 设计 的 语言 。 函 数 是 一 种 对 应 规则 (映射 )， 它 
使 定义 域 的 每 个 元 素 和 值 域 中 唯一 的 元 素 相 对 应 。 

函数 定义 1: Square[x]:=x*x 

函数 定义 2: Plustwo[x]:=Plusone[Plusone[x]] 

函数 定义 3: fact[n]:=if n=0 then 1 else n*fact[n-1] 

在 函数 定义 2 中， 使 用 了 函数 复合 ， 即 将 一 个 函数 调用 丹 套 在 另 一 个 函数 定义 中 。 在 函数 
定义 3 中 ， 函 数 被 递归 定义 。 由 此 可 见 ， 函 数 可 以 看 成 是 一 种 程序 ， 其 输入 就 是 定义 中 左边 括 
号 中 的 量 。 它 也 可 以 将 输入 组 合 起 来 产生 一 个 规则 ， 在 组 合 过 程 中 可 以 使 用 其 他 函数 或 该 函数 
本 身 。 这 种 用 函数 和 表达 式 建立 程序 的 方法 就 是 函数 式 程序 设计 。 函 数 式 程序 设计 语言 的 优点 
之 一 就 是 对 表达 式 中 出 现 的 任何 函数 都 可 以 用 其 他 函数 来 代替 ， 只 要 这 些 函 数 调用 产生 相同 
的 值 。 

函数 式 语言 的 代表 LISP 在 许多 方面 与 其 他 语言 不 同 ， 其 中 最 为 显著 的 是 ， 其 程序 和 数据 
的 形式 是 等 价 的 ， 这 样 数据 结构 就 可 以 作为 程序 执行 ， 程 序 也 可 以 作为 数据 修改 。 在 LISP 中 ， 
大 量 地 使 用 递归 。 常 见 的 函数 式 语言 有 Haskell、Scala、Scheme、APL 等 。 

(4) 届 辑 型 程序 设计 语言 。 光 辑 型 语言 是 一 类 以 形式 罗 辑 为 基础 的 语言 ， 其 代表 是 建立 在 
关系 理论 和 一 阶 谓词 理论 基础 上 的 PROLOG。PROLOG 代表 Programming in Logic。PROLOG 
程序 是 一 系列 事实 、 数 据 对 象 或 事实 间 的 具体 关系 和 规则 的 集合 。 通 过 查询 操作 把 事实 和 规则 
输入 数据 库 。 用 户 通 过 输入 查询 来 执行 程序 。 在 PROLOG 中 ， 关 键 操作 是 模式 匹配 ， 通 过 匹 
配 一 组 变量 与 一 个 预先 定义 的 模式 并 将 该 组 变量 赋 给 该 模式 来 完成 操作 。 以 值 集合 3 和 了 上 的 
二 元 关系 R 为 例 ，R 实现 后 ， 可 以 询问 : 

中 已 知 a 和 65， 确定 R(a,b) 是 否 成 立 。 

@ 已 知 a， 求 所 有 使 R(ay) 成 立 的 y。 

@@ 已 知 罗 ， 求 所 有 使 RG.O 成 立 的 x。 
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@ 求 所 有 使 R(xyp) 成 立 的 x 和 y。 

逻辑 型 程序 设计 具有 与 传统 的 命令 式 程序 设计 完全 不 同 的 风格 PROLOG 数据 库 中 的 事实 
和 规则 是 形式 为 “P:-Pi,P,…,P,” 的 Hore 子 句 ， 其 中 n>20，P;(1<i<n) 为 形 如 Ri(…) 的 断言 ， 
R; 是 关系 名 。 该 子 句 表示 规则 : 若 Pi,P;,…,P, 均 为 真 ( 成 立 )， 则 P 为 真 。 当 n=0 时 ，Hore 子 
句 变 成 P， 这 样 的 子 句 称 为 事实 。 

一 旦 有 了 事实 与 规则 ， 就 可 以 提出 询问 。 测 试用 户 询问 A 是 否 成 立时 ， 采 用 归结 方法 。 

@ 如 果 程 序 中 包含 事实 P， 且 P 和 A 匹配 ， 则 A 成立。 

@ 如 果 程序 中 包含 Hore 子 句 “P:-P1,P;,…,P,”， 且 P 了 和 人 A 匹配 , 则 PROLOG 转 而 测试 Pi、 
P，、…、P,。 只 有 当 Pl、P，、*…、P, 都 成 立时 才能 断言 P 成 立 。 当 求解 某 个 P; 失 败 时 ， 则 返回 
到 前 面 的 某 个 成 功 点 并 尝试 另 一 种 选择 ， 也 就 是 进行 回溯 。 

@ 只 有 当 所 有 的 可 能 情况 都 已 穷尽 时 才能 推导 出 P 失败 。 

PROLOG 有 很 强 的 推理 功能 ， 适 用 于 编写 自动 定理 证 明 、 专 家 系统 和 自然 语言 理解 等 问题 
的 程序 。 


2.1.2 程序 设计 语言 的 基本 成 分 
程序 设计 语言 的 基本 成 分 包括 数据 、 运 算 、 控 制 和 传输 等 。 
1. 程序 设计 语言 的 数据 成 分 


程序 设计 语言 的 数据 成 分 指 一 种 程序 设计 语言 的 数据 类 型 。 数 据 对 象 总 是 对 应 着 应 用 系统 
中 某 些 有 意义 的 东西 ， 数 据 表 示 则 指明 了 程序 中 值 的 组 织 形 式 。 数 据 类 型 用 于 代表 数据 对 象 ， 
还 用 于 在 基础 机 器 中 完成 对 值 的 布局 ， 同 时 还 可 用 于 检查 表达 式 中 对 运算 的 应 用 是 否 正 确 。 

数据 是 程序 操作 的 对 象 ， 具 有 存储 类 别 、 类 型 、 名 称 、 作 用 域 和 生存 期 等 属性 ， 在 使 用 时 
要 为 它 分 配 内 存 空间 。 数 据 名 称 由 用 户 通过 标识 符 命名 ， 标 识 符 是 由 字母 、 数 字 和 下 划 线 “ ” 
组 成 的 标记 ; 类 型 说 明 数 据 占用 内 存 的 大 小 和 存放 形式 ; 存储 类 别 说 明 数 据 在 内 存 中 的 位 置 和 
生存 期 ， 作 用 域 则 说 明 可 以 使 用 数据 的 代码 范围 ， 生 存 期 说 明 数 据 占用 内 存 的 时 间 特 点 。 从 不 
同 角度 可 将 数据 进行 不 同 的 划分 。 

1) 常量 和 变量 

按照 程序 运行 时 数据 的 值 能 否 改变 ， 将 数据 分 为 常量 和 变量 。 程 序 中 的 数据 对 象 可 以 具有 
左 值 和 (或 ) 右 值 ， 左 值 指 存储 单元 或 地 址 、 容 器 )， 右 值 是 值 〈 或 内 容 )。 变 量具 有 左 值 和 
右 值 , 在 程序 运行 过 程 中 其 右 值 可 以 改变 ; 常量 只 有 右 值 ,在 程序 运行 过 程 中 其 右 值 不 能 改变 。 

2) 全 局 量 和 局 部 量 

数据 按 在 程序 代码 中 的 作用 范围 《作用 域 ) 可 分 为 全 局 量 和 局 部 量 。 一 般 情 况 下 ， 全 局 变 
量 的 作用 域 为 整个 文件 或 程序 ， 系 统 为 全 局 变量 分 配 的 存储 空间 在 程序 运行 的 过 程 中 是 不 改变 
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的 ， 局 部 变量 的 作用 域 为 定义 它 的 函数 或 语句 块 ， 为 局 部 变量 分 配 的 存储 单元 是 动态 改变 的 。 
3) 数据 类 型 
按照 数据 组 织 形式 的 不 同 可 将 数据 分 为 基本 类 型 、 用 户 定义 类 型 、 构 造 类 型 及 其 他 类 型 。 
C (C++) 的 数据 类 型 如 下 。 
(1) 基本 类 型 整 型 (int)、 字 符 型 (char)、 实 型 (float、double) 和 布尔 类 型 (bool)。 
(2) 特殊 类 型 : 空 类 型 (void)。 
(3) 用 户 定义 类 型 : 枚 举 类 型 (enum )。 
(4) 构造 类 型 : 数组 、 结 构 、 联 合 。 
(5) 指针 类 型 ， type*。 
(6) 抽象 数据 类 型 : 类 类 型 。 
其 中 ， 布 尔 类 型 和 类 类 型 由 C++ 语言 提供 。 


2. 程序 设计 语言 的 运算 成 分 


程序 设计 语言 的 运算 成 分 指明 允许 使 用 的 运算 符号 及 运算 规则 。 大 多 数 高 级 程序 设计 语言 
的 基本 运算 可 以 分 成 算术 运算 、 关 系 运 算 和 逻辑 运算 等 ， 有 些 语言 (如 C、C++) 还 提供 位 运 
算 。 运 算 符号 的 使 用 与 数据 类 型 密切 相关 。 为 了 明确 运算 结果 ， 运 算 符号 要 规定 优先 级 和 结合 
性 ， 必 要 时 还 要 使 用 圆 括号 。 


3.， 程序 设计 语言 的 控制 成 分 


控制 成 分 指明 语言 允许 表述 的 控制 结构 ， 程 序 员 使 用 控制 成 分 来 构造 程序 中 的 控制 逻辑 。 
理论 上 已 经 证 明 ， 可 计算 问题 的 程序 都 可 以 用 顺序 、 选 择 和 循环 这 3 种 控制 结构 来 描述 。 

1) 顺序 结构 

顺序 结构 用 来 表示 一 个 计算 操作 序列 。 计 算 过 程 从 所 描述 的 第 一 个 操作 开始 ， 按 顺序 依次 
执行 后 续 的 操作 ， 直 到 序列 的 最 后 一 个 操作 ， 如 图 2-1 所 示 。 在 顺序 结构 内 也 可 以 包含 其 他 控 
制 结构 。 

2) 选择 结构 

选择 结构 提供 了 在 两 种 或 多 种 分 支 中 选择 其 中 一 个 的 逻辑 。 基 本 的 选择 结构 是 指定 一 个 条 
件 P， 然 后 根据 条 件 的 成 立 与 否决 定 控制 流 计算 A 还 是 计算 B， 从 两 个 分 支 中 选择 一 个 执行 ， 
如 图 2-2 (a) 所 示 。 选 择 结构 中 的 计算 A 或 计算 B 还 可 以 包含 顺序 、 选 择 和 重复 结构 。 程 序 设 
计 语 言 中 还 通常 提供 简化 了 的 选择 结构 ， 也 就 是 没有 计算 B 的 分 支 结构 ， 如 图 2-2 (b) 所 示 。 

3) 循环 结构 

循环 结构 描述 了 重复 计算 的 过 程 ， 通 常 由 三 部 分 组 成 : 初始 化 、 循 环 体 和 循环 条 件 ， 其 中 
初始 化 部 分 有 时 在 控制 的 逻辑 结构 中 不 进行 显 式 的 表示 。 循 环 结构 主要 有 两 种 形式 : while 型 
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循环 结构 和 do-while 型 循环 结构 。while 型 结构 的 逻辑 含义 是 先 判 断 条 件 P， 若 成 立 ， 则 执行 循 
环 体 A， 然 后 再 去 判断 循环 条 件 ， 否 则 控制 流 就 退出 重复 结构 ， 如 图 2-3 (a) 所 示 。do-while 
型 结构 的 罗 辑 含义 是 先 执行 循环 体 A， 再 判断 条 件 P， 若 成 立 则 继续 执行 A， 然 后 再 判断 条 件 
了 P， 和 否则 控制 流 就 退出 循环 结构 ， 如 图 2-3 (b) 所 示 。 


不 成 立 ( 假 ) 不 成 立 ( 假 ) 
1 
B 成 立 ( 真 ) 
1 A B A 
C 
户 ”一 户 
(a) 分 支 结构 1 (b) 分 支 结构 2 
图 2-1 顺序 结构 示意 图 图 2-2 选择 结构 示意 图 


tr | 和 


A 
不 成 立 ( 假 ) 


成 立 ( 真 ) 


站 一 一 


(a) while 型 循环 结构 (b) do-while 型 循环 结构 


图 2-3 循环 结构 示意 图 


4) C〈C++) 语言 提供 的 控制 语句 

(1) 复合 语句 。 复 合 语句 用 于 描述 顺序 控制 结构 。 复 合 语句 是 一 系列 用 “{ ”和 “}” 括 起 
来 的 声明 和 语句 ， 其 主要 作用 是 将 多 条 语句 组 成 一 个 可 执行 单元 。 在 语法 上 能 出 现 语句 的 地 方 
都 可 以 使 用 复合 语句 。 复 合 语句 是 一 个 整体 ， 要 么 全 部 执行 ， 要 么 一 条 语句 也 不 执行 。 

(2) 让 语句 和 switch 语句 。 

@ 让 语句 实现 的 是 双 分 支 的 选择 结构 ， 其 一 般 形 式 为 : 


让 (表达 式 ) 语句 1;else 语句 2; 
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其 中 ,语句 1 和 语句 2 可 以 是 任何 合法 的 C (C++) 语句 ， 当 语句 2 为 空 语 句 时 ， 可 以 简化 为 : 
让 (表达 式 ) 语句 1; 
在 使 用 站 语句 时 ， 需 要 注意 过 和 else 的 匹配 关系 。C (C++) 语言 规定 ，else 总 是 与 离 它 
最 近 的 尚 没有 else 的 过 相 匹 配 。 
@ switch 语句 描述 了 多 分 支 的 选择 结构 ， 其 一 般 形 式 为 : 
switch (表达 式 ) { 
case 常量 表达 式 1: 语句 1; 
case 常量 表达 式 2: 语句 2; 


case 常量 表达 式 mn: 语句 1; 
default: 语句 n+1; 
} 


在 执行 switch 语句 时 ， 首 先 计算 表达 式 的 值 ， 然 后 用 所 得 的 值 与 列举 的 常量 表达 式 值 依 次 
比较 ， 若 任 一 常量 表达 式 都 不 能 与 所 得 的 值 相 匹 配 ， 则 执行 default 的 “语句 序列 nt1”， 然 后 结束 
switch 语句 。 若 表达 式 的 值 与 常量 表达 式 i(i=1,2,…,n) 的 值 相同 ， 则 执行 “语句 序列 1”， 当 case 
i 的 语句 序列 i 中 无 break 语句 时 ， 执 行 随后 的 语句 序列 寺 1， 语 句 序列 i+2，…… 直到 执行 完 语 
句 序列 ntl 后 退出 switch 语句 ; 或 者 遇 到 break 时 跳出 switch 语句 。 如 果 要 使 程序 在 执行 “ 语 
名 序列 i” 后 结束 整个 switch 语句 ， 则 语句 序列 i 中 应 包含 控制 流 能 够 到 达 的 break 语句 。 

表达 式 可 以 是 任何 类 型 的 ， 常 用 的 是 字符 型 或 整 型 表达 式 。 多 个 常量 表达 式 可 以 共用 一 个 
语句 组 。 语 句 组 可 以 包括 任何 可 执行 语句 ， 且 无 须 用 “{ ”和 “}” 插 起 来 。 

(3) 循环 语句 。C (C++) 语言 提供 了 3 种 形式 的 循环 语句 用 于 描述 循环 计算 的 控制 结构 。 

@ while 语句 。while 语句 描述 了 先 判断 条 件 再 执行 循环 体 的 控制 结构 ， 其 一 般 形式 为 : 

while (条 件 表达 式 ) 循环 体 语句 ; 

其 中 ， 循 环 体 语句 是 内 嵌 的 语句 ， 当 循环 体 语句 多 于 一 条 时 ， 应 使 用 “{ ”和 “}” 括 起 来 。 在 
执行 while 语句 时 ， 先 计算 条 件 表达 式 的 值 ， 当 值 为 非 0 时 ， 执 行 循环 体 语 句 ， 然 后 重新 计算 
条 件 表达 式 的 值 再 进行 判断 ， 否 则 就 结束 while 语句 的 执行 过 程 。 

@ do-while 语句 。do-while 语句 描述 了 先 执行 循环 体 再 判断 条 件 的 控制 结构 ， 其 一 般 形 
式 为 : 

do 

循环 体 语句 ; 
while (条 件 表达 式 ); 
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do-while 循环 语句 是 先 执行 循环 体 语句 ， 然 后 再 计算 条 件 表达 式 的 值 ， 若 值 为 非 0， 则 再 
一 次 执行 循环 体 语句 和 计算 条 件 表 达 式 并 进行 判断 ， 直 到 条 件 表达 式 的 值 为 0 时 结束 do-while 
语句 的 执行 过 程 。 
@ for 语句 。for 语句 的 基本 形式 为 : 
for( 表 达 式 1; 表 达 式 2; 表 达 式 3) 循环 体 语句 ; 
可 用 while 语句 等 价 地 表示 为 : 
表达 式 1; 
while( 表 达 式 2){ 
循环 体 语句 ; 
表达 式 3; 
} 
for 语句 的 使 用 是 很 灵活 的 , 其 内 部 的 3 个 表达 式 都 可 以 省 略 , 但 用 于 分 隔 3 个 表达 式 的 分 
号 “;” 不 能 省 略 。 
C 语言 中 还 提供 了 实现 控制 流 跳 转 的 goto、break 和 continue 语句 ， 由 于 goto 会 破坏 程序 
的 逻辑 结构 ， 因 此 不 提倡 使 用 。 


4. 程序 设计 语言 的 传输 成 分 
程序 设计 语言 的 传输 成 分 指明 语言 允许 的 数据 传输 方式 ， 如 赋值 处 理 、 数 据 的 输入 和 输出 等 。 
S， 函数 


C 程序 由 一 个 或 多 个 函数 组 成 ， 每 个 函数 都 有 一 个 名 字 ， 其 中 有 且 仅 有 一 个 名 字 为 main 
的 函数 作为 程序 运行 时 的 起 点 。 函 数 是 程序 模块 的 主要 成 分 ， 它 是 一 段 具 有 独立 功能 的 程序 。 
函数 的 使 用 涉及 3 个 概念 : 函数 定义 、 函 数 声明 和 函数 调用 。 

1) 函数 定义 

函数 的 定义 包括 两 部 分 : 函数 首部 和 函数 体 。 函 数 的 定义 描述 了 函数 做 什么 和 怎么 做 。 函 
数 定义 的 一 般 形式 为 : 


返回 值 的 类 型 ”函数 名 (形式 参数 表 ) /函数 首部 
{ 
函数 体 ; 
} 
函数 首部 说 明了 函数 返回 值 的 数据 类 型 、 函 数 的 名 字 和 函数 运行 时 所 需 的 参数 及 类 型 。 函 
数 所 实现 的 功能 在 函数 体 部 分 进行 描述 。 


加 ‘加 
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C (C++) 程序 中 所 有 函数 的 定义 都 是 独立 的 。 在 一 个 函数 的 定义 中 不 允许 定义 另外 一 个 
函数 ， 也 就 是 不 允许 函数 的 嵌 套 定义 。 

2) 函数 声明 

函数 应 该 先 声明 后 引用 。 如 果 程 序 中 对 一 个 函数 的 调用 在 该 函数 的 定义 之 前 进行 ， 则 应 该 
在 调用 前 对 被 调用 函数 进行 声明 。 函 数 原型 用 于 声明 函数 。 函 数 声明 的 一 般 形 式 为 : 

返回 值 类 型 函数 名 (参数 类 型 表 ); 

使 用 函数 原型 的 目的 在 于 告诉 编译 器 传递 给 函数 的 参数 个 数 、 类 型 以 及 函数 返回 值 的 类 
型 ， 参 数 表 中 仅 需 要 依次 列 出 函数 定义 时 参数 的 类 型 ， 从 而 使 编译 器 能 够 检查 源 程序 中 对 函数 
的 调用 形式 是 否 正 确 。 

3) 函数 调用 

当 在 一 个 函数 〈 称 为 调用 函数 ) 中 需要 使 用 另 一 个 函数 ( 称 为 被 调用 函数 ) 实现 的 功能 时 ， 
便 以 名 字 进 行 调用 ， 称 为 函数 调用 。 在 使 用 一 个 函数 时 ， 只 要 知道 如 何 调用 就 可 以 了 ， 并 不 需 
要 关心 被 调用 函数 的 内 部 实现 。 因 此 ， 调 用 函数 需要 知道 被 调用 函数 的 名 字 、 返 回 值 和 需要 向 
被 调 函数 传递 的 参数 〈 个 数 、 类 型 、 顺 序 ) 等 信息 。 

函数 调用 的 一 般 形式 为 : 

函数 名 ( 实 参 表 ); 

在 C 程 序 的 执行 过 程 中 , 通过 函数 调用 实现 了 函数 定义 时 描述 的 功能 。 在 函数 体 中 若 调 用 
自己 ， 则 称 为 递归 调用 。 

C 和 C++ 通过 传 值 方式 将 数据 传递 给 形 参 。 调 用 函数 和 被 调用 函数 之 间 交 换 信息 的 方法 主 
要 有 两 种 : 一 种 是 由 被 调用 函数 把 返回 值 返回 给 主 调 函数 ， 另 一 种 是 通过 参数 带 回 信息 。 函 数 
调用 时 实 参与 形 参 间 交换 信息 的 方法 有 值 调 用 和 引用 调用 两 种 。 

(1) 值 调用 (Call by Value)。 若 实现 函数 调用 时 将 实 参 的 值 传递 给 相应 的 形 参 ， 则 称 为 是 
传 值 调用 。 在 这 种 方式 下 形 参 不 能 向 实 参 传递 信息 。 

在 C 语言 中 ， 要 实现 被 调用 函数 对 实 参 的 修改 ， 必 须 用 指针 作为 参数 。 即 调用 时 需要 先 对 
实 参 进 行 取 地 址 运算 ， 然 后 将 实 参 的 地 址 传递 给 指针 形 参 。 其 本 质 上 仍 属于 值 调用 。 这 种 方式 
实现 了 间接 内 存 访 问 。 

(2) 引用 调用 (Call by Reference)。 引 用 是 C++ 中 引入 的 概念 ， 当 形式 参数 为 引用 类 型 时 ， 
形 参 名 实际 上 是 实 参 的 别名 ， 函 数 中 对 形 参 的 访问 和 修改 实际 上 就 是 针对 相应 实 参 所 做 的 访问 
和 改变 。 例 如 : 

void swap(int &x,int&y)  { /* 交 换 x 和 y*/ 

int temp; 
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temp=x: x-y; ytemp: 
} 
函数 调用 : swap(a,b); 
在 实现 swap(a,b) 调 用 时 ，x、y 就 是 a、b 的 别名 ， 因 此 ， 函 数 调用 完成 后 ， 交 换 了 a 和 
的 值 。 


2.2 ”语言 处 理 程序 基础 


语言 处 理 程序 是 一 类 系统 软件 的 总 称 ,其 主要 作用 是 将 高 级 语言 或 汇编 语言 编写 的 程序 翻 
译 成 某 种 机 器 语言 程序 ， 使 程序 可 在 计算 机 上 运行 。 语 言 处 理 程序 主要 分 为 汇编 程序 、 编 译 程 
序 和 解释 程序 3 种 基本 类 型 。 


2.2.1 汇编 程序 基本 原理 
1， 汇 编 语言 


汇编 语言 是 为 特定 的 计算 机 设计 的 面向 机 器 的 符号 化 的 程序 设计 语言 。 用 汇编 语言 编写 的 
程序 称 为 汇编 语言 源 程序 。 因 为 计算 机 不 能 直接 识别 和 运行 符号 语言 程序 ， 所 以 要 用 专门 的 翻 
译 程序 一 一 汇编 程序 进行 翻译 。 用 汇编 语言 编写 程序 要 遵循 所 用 语言 的 规范 和 约定 。 

汇编 语言 源 程序 由 若干 条 语句 组 成 ， 其 中 可 以 有 三 类 语句 :指令 语句 、 伪 指令 语句 和 宏 指 
令 语句 。 

(1) 指令 语句 。 指 令 语句 又 称 为 机 器 指令 语句 ， 将 其 汇编 后 能 产生 相应 的 机 器 代码 ， 这 些 
代码 能 被 CPU 直接 识别 并 执行 相应 的 操作 。 基 本 的 指令 有 ADD、SUB 和 AND 等 ， 书 写 指令 
语句 时 必须 遵循 指令 的 格式 要 求 。 

指令 语句 可 分 为 传送 指令 、 算 术 运 算 指令 、 罗 辑 运 算 指令 、 移 位 指令 、 转 移 指令 和 处 理 机 
控制 指令 等 类 型 。 

(2) 伪 指 令 语句 。 伪 指令 语句 指示 汇编 程序 在 汇编 源 程序 时 完成 某 些 工作 ， 例 如 为 变量 分 
配 存 储 单元 地 址 ， 给 某 个 符号 赋 一 个 值 等 。 伪 指令 语句 与 指令 语句 的 区 别 是 : 伪 指 令 语句 经 汇 
编 后 不 产生 机 器 代码 ， 而 指令 语句 经 汇编 后 要 产生 相应 的 机 器 代码 。 另 外 ， 伪 指令 语句 所 指示 
的 操作 是 在 源 程序 被 汇编 时 完成 的 ， 而 指令 语句 的 操作 必须 在 程序 运行 时 完成 。 

(3) 宏 指 令 语句 。 在 汇编 语言 中 ， 还 允许 用 户 将 多 次 重复 使 用 的 程序 段 定义 为 宏 。 宏 的 定 
义 必须 按照 相应 的 规定 进行 ， 每 个 宏 都 有 相应 的 宏 名 。 在 程序 的 任意 位 置 ， 若 需要 使 用 这 段 程 
序 ， 只 要 在 相应 的 位 置 使 用 宏 名 ， 即 相当 于 使 用 了 这 上段 程序 。 因此， 宏 指令 语句 就 是 宏 的 引用 。 
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2. 汇编 程序 


汇编 程序 的 功能 是 将 用 汇编 语言 编写 的 源 程 序 翻译 成 机 器 指令 程序 。 汇编 程序 的 基本 工作 
包括 将 每 一 条 可 执行 汇编 语句 转换 成 对 应 的 机 器 指令 ， 处 理 源 程序 中 出 现 的 伪 指 令 。 由 于 汇编 
指令 中 形成 操作 数 地 址 的 部 分 可 能 出 现 后 面 才 会 定义 的 符号 ， 所 以 汇编 程序 一 般 需 要 两 次 扫描 
源 程序 才能 完成 翻译 过 程 。 

第 一 次 扫描 的 主要 工作 是 定义 符号 的 值 并 创建 一 个 符号 表 ST，ST 记录 了 汇编 时 所 直到 的 
符号 的 值 。 另 外 ， 有 一 个 固定 的 机 器 指令 表 MOT1， 其 中 记录 了 每 条 机 器 指令 的 记忆 码 和 指令 
的 长 度 。 在 汇编 程序 翻译 源 程序 的 过 程 中 ， 为 了 计算 各 汇编 语句 标号 的 地 址 ， 需 要 设立 一 个 位 
置 计数 器 或 单元 地 址 计数 器 LC (Location Counter)， 其 初 值 一 般 为 0。 在 扫描 源 程序 时 ， 每 处 
理 完 一 条 机 器 指令 或 与 存储 分 配 有 关 的 伪 指 令 〈 如 定义 常数 语句 、 定 义 储存 语句 )，LC 的 值 就 
增加 相应 的 长 度 。 这 样 ， 在 汇编 过 程 中 ，LC 的 内 容 就 是 下 一 条 被 汇编 的 指令 的 偏 移 地 址 。 若 
正在 汇编 的 语句 是 有 标号 的 ， 则 该 标号 的 值 就 取 LC 的 当前 值 。 

此 外 ， 在 第 一 次 扫描 中 ， 还 需要 对 与 定义 符号 值 有 关 的 伪 指 令 进 行 处 理 。 为 了 叙述 方便 ， 
不 妨 设立 伪 指 令 表 POT1。POT1 表 的 每 一 个 元 素 只 有 两 个 域 : 伪 指 令 助 记 符 和 相应 的 子 程序 入 
口 。 下 面 的 步骤 (1) 一 5) 描述 了 汇编 程序 第 一 次 扫描 源 程序 的 过 程 。 

(1) 单元 计数 器 LC 置 初 值 0。 

(2) 打开 源 程序 文件 。 

(3) 从 源 程序 中 读 入 第 一 条 语句 。 

(4) while ( 若 当前 语句 不 是 END 语句 ) { 

近 当 前 语句 有 标号 ) 则 将 标号 和 单元 计数 器 LC 的 当前 值 填 入 符号 表 ST; 

这 当前 语句 是 可 执行 的 汇编 指令 语句 ) 则 查找 MOTI1 表 获 得 当前 指令 的 长 度 K, 并 令 LC=LC+K; 
近 当 前 指令 是 伪 指 令 ) 则 查找 POT1 表 并 调用 相应 的 子 程序 ; 

近 当 前 指令 的 操作 码 是 非法 记忆 码 ) 则 调用 出 错 处 理子 程序 。 

从 源 程序 中 读 入 下 一 条 语句 ; 

} 

(5) 关闭 源 程序 文件 。 

第 二 次 扫描 的 任务 是 产生 目标 程序 。 除 了 使 用 前 一 次 扫描 所 生成 的 符号 表 ST 外 ， 还 要 使 
用 机 器 指令 表 MOT2 ， 该 表 中 的 元 素 有 机 器 指令 助 记 符 、 机 器 指令 的 二 进 制 操作 码 
(Binary-code)、 格 式 〈Type) 和 长 度 (Length)。 此 外 ， 还 要 设立 一 个 伪 指 令 表 POT2， 供 第 二 
次 扫描 时 使 用 。POT2 的 每 一 元 素 仍 有 两 个 域 : 伪 指 令 记忆 码 和 相应 的 子 程序 入 口 。 与 第 一 次 
扫描 的 不 同 之 处 是 : 在 第 二 次 扫描 中 ， 伪 指令 有 着 完全 不 同 的 处 理 。 

在 第 二 次 扫描 中 ， 可 执行 汇编 语句 应 被 翻译 成 对 应 的 二 进 制 代码 机 器 指令 。 这 一 过 程 涉及 


两 个 方面 的 工作 : 一 是 把 机 器 指令 助 记 符 转换 成 二 进 制 机 器 指令 操作 码 ， 这 可 通过 查找 MOT2 
表 来 实现 ; 二 是 求 出 操作 数 区 各 操作 数 的 值 (用 二 进 制 表示 )。 在 此 基础 上 ， 就 可 以 装配 出 用 


二 进 制 代 码 表示 的 机 器 指令 。 
2.2.2 ”编译 程序 基本 原理 


1. 编译 过 程 概述 


编译 程序 的 功能 是 把 某 高 级 语言 书写 的 源 程序 翻译 成 与 之 等 价 的 目标 程序 (汇编 语言 或 机 


器 语言 )。 编译 程序 的 工作 过 程 可 以 分 为 6 
个 阶段 ， 如 图 2-4 所 示 ， 在 实际 的 编译 器 
中 可 能 会 将 其 中 的 某 些 阶 段 结 合 在 一 起 进 
行 处 理 。 

下 面 简 要 介绍 各 阶段 实现 的 主要 
功能 。 

1) 词法 分 析 

源 程序 可 以 简单 地 被 看 成 是 一 个 多 
行 的 字符 串 。 词 法 分 析 阶 段 是 编译 过 程 的 
第 一 个 阶段 ， 这 个 阶段 的 任务 是 对 源 程序 
从 前 到 后 《〈 从 左 到 右 ) 逐个 字符 地 扫描 ， 
从 中 识别 出 一 个 个 “单词 ”符号 。“ 单 词 ” 
符号 是 程序 设计 语言 的 基本 语法 单位 ， 如 
关键 字 (或 称 保留 字 )、 标 识 符 、 常 数 、 运 


算 符 和 分 隔 符 (如 标点 符号 、 左 右 插 号 ) 等 。 词 法 分 析 程 序 输 出 的 “单词 ” 常 以 二 元 组 的 方式 


输出 ， 即 单词 种 别 和 单词 自身 的 值 。 


词法 分 析 过 程 依据 的 是 语言 的 词法 规则 , 即 描述 “单词 ”结构 的 规则 。 例 如 , 对 于 某 PASCAL 


源 程序 中 的 一 条 声明 语句 和 赋值 语句 : 


VAR X,Y,Z:real; 
X:=Y+Z*60; 


第 2 章 程序 设计 语言 基础 知识 


目标 代码 生成 


目标 代码 
图 2-4 ”编译 器 的 工作 阶段 示意 图 


词法 分 析 阶 段 将 构成 这 条 语句 的 字符 串 分 割 成 如 下 的 单词 序列 。 


(1) 保留 字 VAR 
(3) 逗号 
(5) 逗号 


(2) 标识 符 X 
(4) 标识 符 区 
(6) 标识 符 yA 


加 。% 国 
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(7) 冒号 ‘ (8) 标准 标识 符 ”real 
(9) 分 号 (10) 标识 符 x 
(11) 赋值 号 党 (12) 标识 从 Y 
(13) 加 号 十 (14) 标识 符 Zz 
(15) 乘 号 - (16) 整 常数 60 
(17) 分 号 


对 于 标识 符 X、Y、Z， 其 单词 种 别 都 是 id 〈 用 户 标识 符 )， 字 符 串 “X”“Y” 和 “Z” 都 
是 单词 的 值 ， 而 对 于 单词 60， 整 常数 是 该 单词 的 种 别 ，60 是 该 单词 的 值 。 下 面 用 idl 、id2 和 
id3 分 别 代 表 义 、Y 和 Z， 强 调 标识 符 的 内 部 标识 由 于 组 成 该 标识 符 的 字符 串 不 同 而 有 所 区 别 。 
经 过 词法 分 析 后 ， 声 明 语句 “VAR XYZ:real; ”表示 为 “VAR idl,id2,id3:real; ”>， 赋 值 语 句 
“X:=Y+Z*60:” 表 示 为 “idl:=id2+id3*60:”。 

2) 语法 分 析 

语法 分 析 的 任务 是 在 词法 分 析 的 基础 上 , 根据 语言 的 语法 规则 将 单词 符号 序列 分 解 成 各 类 
语法 单位 ， 如 “表达 式 ”“ 语 句 ” 和 “程序 ”等 。 语 法 规则 就 是 各 类 语法 单位 的 构成 规则 。 通 
过 语法 分 析 确 定 整 个 输入 串 是 否 构成 一 个 语法 上 正确 的 程序 。 如 果 源 程序 中 没有 语法 错误 ， 语 
法 分 析 后 就 能 正确 地 构造 出 其 语法 树 ; 否则 指出 语法 错误 ， 并 给 出 相应 的 诊断 信息 。 对 
idl:=id2+id3*60 进行 语法 分 析 后 形成 的 语法 树 如 图 2-5 所 示 。 


> > 
> 一 人 


Rs ”2 


idl id3 60 
图 2-5 语法 树 示 意图 


词法 分 析 和 语法 分 析 在 本 质 上 都 是 对 源 程序 的 结构 进行 分 析 。 

3) 语义 分 析 

语义 分 析 阶 段 分 析 各 语法 结构 的 含义 ， 检 查 源 程序 是 否 包 含 静态 语义 错误 ， 并 收集 类 型 信 
息 供 后 面 的 代码 生成 阶段 使 用 。 只 有 语法 和 语义 都 正确 的 源 程序 才能 翻译 成 正确 的 目标 代码 。 

语义 分 析 的 一 个 主要 工作 是 进行 类 型 分 析 和 检查 。 程 序 设计 语言 中 的 一 个 数据 类 型 一 般 包 
含 两 个 方面 的 内 容 : 类 型 的 载体 及 其 上 的 运算 。 例 如 ， 整 除 取 余 运 算 符 只 能 对 整 型 数据 进行 运 
算 ， 若 其 运算 对 象 中 有 浮 点 数 就 认为 是 类 型 不 匹配 的 错误 。 
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在 确认 源 程序 的 语法 和 语义 之 后 ， 即 可 对 其 进行 翻译 并 给 出 源 程序 的 内 部 表示 。 对 于 声明 
语句 ， 需 要 记录 所 过 到 的 符号 的 信息 ， 所 以 应 进行 符号 表 的 填 查 工作 。 在 图 2-6 所 示 的 符号 表 
中 ， 每 一 行 存放 一 个 符号 的 信息 。 第 一 行 存放 标识 符 X 的 信息 ， 其 类 型 为 real， 为 它 分 配 的 邮 
辑 地 址 是 0， 第 二 行 存放 立 的 信息 ， 其 类 型 是 real， 为 它 分 配 的 逻辑 地 址 是 4。 在 这 种 语言 中 ， 
为 一 个 real 型 数据 分 配 的 存储 空间 是 4 个 存储 单元 。 对 于 可 执行 语句 ， 则 检查 结构 合理 的 表达 
式 是 否 有 意义 。 对 id1:=id2+id3*60 进行 语义 分 析 后 的 语法 树 如 图 2-6 所 示 ， 其 中 增加 了 一 个 语 
义 处 理 结 点 inttoreal， 该 运算 用 于 将 一 个 整 型 数 转换 为 浮 点 数 。 


符号 表 部 分 内 容 := 


一 六 


id3 inttoreal 


60 


图 2-6 语义 分 析 后 的 符号 表 和 语法 树 示意 图 


4) 中 间 代 码 生成 

中 间 代 码 生成 阶段 的 工作 是 根据 语义 分 析 的 输出 生成 中 间 代 码 。“ 中 间 代 码 ” 是 一 种 简单 
且 含义 明确 的 记号 系统 ， 可 以 有 若干 种 形式 ， 它 们 的 共同 特征 是 与 具体 的 机 器 无 关 。 最 常用 的 
一 种 中 间 代 码 是 与 汇编 语言 的 指令 非常 相似 的 三 地 址 码 ， 其 实现 方式 常 采用 四 元 式 。 四 元 式 的 
形式 为 : 


(运算 符 , 运 算 对 象 ,运算 对 象 2, 运 算 结果 ) 


例如 ， 对 于 语句 义 :=Y+Z*60， 可 生成 以 下 四 元 式 序列 : 
GD (inttoreal,60, -,t1) 


四 怕人 才 1d3,t1,t2) 
®@ (+ id2,t2,t3) 
国生 13, -,id1) 


其 中 ，t1、 纪 、43 是 编译 程序 生成 的 临时 变量 ， 用 于 存放 临时 的 运算 结果 。 
语义 分 析 和 中 间 代 码 生成 所 依据 的 是 语言 的 语义 规则 。 
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5) 代码 优化 

由 于 编译 器 将 源 程序 翻译 成 中 间 代码 的 工作 是 机 械 的 、 按 固定 模式 进行 的 ， 因 此 ， 生 成 的 
中 间 代 码 往往 在 时 间 上 和 空间 上 有 较 大 的 浪费 。 当 需要 生成 高 效 的 目标 代码 时 , 必须 进行 优化 。 
优化 过 程 可 以 在 中 间 代 码 生成 阶段 进行 ， 也 可 以 在 目标 代码 生成 阶段 进行 。 由 于 中 间 代 码 不 依 
束 于 具体 机 器 ， 此 时 所 做 的 优化 一 般 建立 在 对 程序 的 控制 流 和 数据 流 分 析 的 基础 之 上 ， 与 具体 
的 机 器 无 关 。 优 化 所 依据 的 原则 是 程序 的 等 价 变换 规则 。 例如 , 在 生成 X:=Y+2*60 的 四 元 式 后 ， 
60 是 编译 时 已 知 的 常数 ， 把 它 转换 为 60.0 的 工作 可 以 在 编译 时 完成 ， 没 有 必要 生成 一 个 四 元 
式 ， 同 时 t3 仅仅 用 来 将 其 值 传递 给 idl， 也 可 以 将 其 简化 掉 ， 因 此 上 述 的 中 间 代 码 可 优化 成 下 
面 的 等 价 代码 : 

@ (*#id3,60.0.t) 

© (Hid2.tl, id]) 

这 只 是 优化 工作 中 的 一 个 简单 示例 ， 实 际 的 优化 工作 还 要 涉及 公共 子 表 达 式 的 提取 、 循 环 
优化 等 更 多 的 内 容 和 技术 。 

6) 目标 代码 生成 

目标 代码 生成 是 编译 器 工作 的 最 后 一 个 阶段 。 这 一 阶段 的 任务 是 把 中 间 代 码 变换 成 特定 机 
器 上 的 绝对 指令 代码 、 可 重 定位 的 指令 代码 或 汇编 指令 代码 ， 这 个 阶段 的 工作 与 具体 的 机 器 密 
切 相关 。 例 如 ， 使 用 两 个 寄存 器 Rl1 和 R2， 可 对 上 述 的 四 元 式 生 成 下 面 的 目标 代码 : 

MOVvF id, R2 

@ MULF #60.0, R2 

@ MOVF id, Rl 

@ADDF BR2, Rl 

@MOVF Rl, idl 
这 里 用 # 表 明 60.0 为 常数 。 

7) 符号 表 管理 

符号 表 的 作用 是 记录 源 程序 中 各 个 符号 的 必要 信息 ， 以 辅助 语义 的 正确 性 检查 和 代码 生 
成 ， 在 编译 过 程 中 需要 对 符号 表 进行 快速 有 效 地 查找 、 插 入 、 修 改 和 删除 等 操作 。 符 号 表 的 建 
立 可 以 始 于 词法 分 析 阶 段 ， 也 可 以 放 到 语法 分 析 和 语义 分 析 阶 段 ， 但 符号 表 的 使 用 有 时 会 延续 
到 目标 代码 的 运行 阶段 。 

8) 出 错 处 理 

用 户 编写 的 源 程序 不 可 避免 地 会 有 一 些 错误 ， 这 些 错 误 大 致 可 分 为 静态 错误 和 动态 错误 。 
动态 错误 也 称 动态 语义 错误 ， 它 们 发 生 在 程序 运行 时 ， 例 如 变量 取 零 时 做 除数 、 引 用 数组 元 素 
下 标 错 误 等 。 静 态 错误 是 指 编译 阶段 发 现 的 程序 错误 ， 可 分 为 语法 错误 和 静态 语义 错误 ， 如 单 
词 拼写 错误 、 标 点 符号 错误 、 表 达 式 中 缺少 操作 数 、 括 号 不 匹配 等 有 关 语言 结构 上 的 错误 称 为 
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语法 错误 ， 而 语义 分 析 时 发 现 的 运算 符 与 运算 对 象 类 型 不 合法 等 错误 属于 静态 语义 错误 。 

在 编译 时 发 现 程序 中 的 错误 后 ， 编 译 程序 应 采用 适当 的 策略 修复 它们 ， 使 得 分 析 过 程 能 够 
继续 下 去 ， 以 便 在 一 次 编译 过 程 中 尽 可 能 多 地 找 出 程序 中 的 错误 。 

对 于 编译 过 程 的 各 个 阶段 ， 在 逻辑 上 可 以 把 它们 划分 为 前 端 和 后 端 两 部 分 。 前 端 包括 从 词 
法 分 析 到 中 间 代 码 生 成 各 阶段 的 工作 , 后 端 包括 中 间 代 码 优 化 和 目标 代码 的 生成 、 优 化 等 阶段 。 
这 样 ， 以 中 间 代 码 为 分 水 岭 ， 把 编译 器 分 成 了 与 机 器 有 关 的 部 分 和 与 机 器 无 关 的 部 分 。 如 此 一 
来 ， 对 于 同一 种 程序 设计 语言 的 编译 器 ， 开 发 出 一 个 前 端 之 后 ， 就 可 以 针对 不 同 的 机 器 开发 相 
应 的 后 端 ， 前 、 后 端 有 机 结合 后 就 形成 了 该 语言 的 一 个 编译 器 。 当 语言 有 改动 时 ， 只 会 涉及 前 
端 部 分 的 维护 。 

对 于 不 同 的 程序 设计 语言 ， 分 别 设计 出 相应 的 前 端 ， 然 后 将 各 个 语言 的 前 端 与 同一 个 后 端 
相 结合 ， 就 可 以 得 到 各 个 语言 在 某 种 机 器 上 的 编译 器 。 


2. 文法 和 语言 的 形式 描述 


1) 字母 表 、 字 符 串 、 字 符 串 集合 及 运算 

e 字母 表 Z 和 字符 : 字母 表 是 字符 的 非 空 有 穷 集合 ， 字 符 是 字母 表 中 的 元 素 。 例 如 
一 {a,b}，a 或 b 是 字符 。 

。 ”字符 串 : 三 中 的 字符 组 成 的 有 穷 序列 。 例 如 a、ab、aaa 都 是 上 的 字符 串 。 

。 字符 串 的 长 度 : 指 字符 串 中 的 字符 个 数 。 如 labal=3。 

。 。 空 串 s: 由 零 个 字符 组 成 的 序列 ，|s=0。 

e。 连接 : 字符 串 S 和 T 的 连接 是 指 将 串 工 接续 在 串 S 之后, 表示 为 S`T, 连接 符号 “。” 
可 省 略 。 显 然 ， 对 于 字母 表 工 上 的 任意 字符 串 S，S。s=s。S=S。 

。 : 指 包括 空 串 s 在 内 的 上 所 有 字符 串 的 集合 。 例 如 ， 设 2={a,b}， 
5’={s,a,b,aa,bb,ab,ba,aaa,…}。 

。 字符 串 的 方 守 : 把 字符 串 x 自身 连接 n 次 得 到 的 串 ， 称 为 字符 串 & 的 n 次 方 军 ， 记 为 
a"s Qa =8,0" =a0" =a" lg (n>0)。 

。 字符 串 集合 的 运算 : 设 4、B 代表 字母 表 王 上 的 两 个 字符 串 集合 。 
2 或 (合并 ): 4UB={alae 4 或 a eB}。 
2 积 (连接 ): 4B={aplae AHPeB}。 
2 究 : 由 =44 =d 4(0>0)， 并 规定 4 ={e}。 
< 正则 闭 包 +: 4+ =4UZUZ2U…U4U…。 
9% 闭 包 *， 人 =49UA4'。 显然 ， 这 =UDUU…UU…。 
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2) 文法 和 语言 的 形式 描述 

语言 L 是 有 限 字 母 表 上 的 有 限 长 度 字符 串 的 集合 , 这 个 集合 中 的 每 个 字符 串 都 是 按照 一 
定 的 规则 生成 的 。 下 面 从 产生 语言 的 角度 出 发 ， 给 出 文法 和 语言 的 定义 。 所 谓 产 生 语 言 ， 是 指 
制定 出 有 限 个 规则 ， 借 助 它们 就 能 产生 此 语言 的 全 部 句子 。 

(1) 文法 的 定义 。 描 述 语言 语法 结构 的 规则 称 为 文法 。 文 法 G 是 一 个 四 元 组 ， 可 表示 为 
G-( Vr, P, S)， 其 中 玉 是 一 个 非 空 有 限 集 ， 其 每 个 元 素 称 为 一 个 终结 符 ，Vy 是 一 个 非 空 有 限 
集 ， 其 每 个 元 素 称 为 非 终结 符 。 了 故人 万 = 更 ， 即 VW 和 琅 不 含 公共 元 素 。 令 V= 二 VU 成 ， 称 VV 
为 文法 G 的 词汇 表 ，V 中 的 符号 称 为 文法 符号 ,包括 终结 符 和 非 终结 符 。P 是 产生 式 的 有 限 集 
合 ， 每 个 产生 式 是 形 如 “a 一 B” 的 规则 ， 其 中 ，a 称 为 产生 式 的 左 部 ，we 斑 且 c 中 至 少 含有 
一 个 非 终 结 符 ，B 称 为 产生 式 的 右 部 ， 且 Bp eV* 。 若 干 个 产生 式 a 一 有 ,ac 一 忆 ,wa 的 
左 部 相同 时 ， 可 简写 为 a 一 B11…|， 称 BQ<i<n) 为 a 的 一 个 候选 式 。SE Vw， 称 为 开 
始 符号 ， 它 至 少 要 在 一 条 产生 式 中 作为 左 部 出 现 。 

(2) 文法 的 分 类 。 乔 姆 斯 基 〈Chomsky) 把 文法 分 成 4 种 类 型 ， 即 0 型 、1 型 、2 型 和 3 
型 。 这 4 类 文法 之 间 的 差别 在 于 对 产生 式 要 施加 不 同 的 限制 。 若 文法 G =(Vy, Vz, 已 3 的 每 个 
产生 式 a 一 8， 均 有 we (Vy UU 成 )* ，a 至 少 含 有 一 个 非 终结 符 ， 且 Be(Vy UW)， 则 称 G 为 0 
型 文法 。 对 0 型 文法 的 每 条 产生 式 分 别 施加 以 下 限制 ， 则 可 得 以 下 文法 。 

。 “1 型 文法 : G 的 任何 产生 式 a 一 B (S 一 gs 除外 ) 均 满足 |e|<|B| “| 表示 x 中 文法 符号 

的 个 数 )。 

。 ”2 型 文法 : G 的 任何 产生 式 形 如 A 一 B， 其 中 AEVy，pBe(Vy UW)。 

e 3 型 文法 : G 的 任何 产生 式 形 如 A 一 a 或 A 一 aB (或 者 A 一 Ba)， 其 中 A, BEeVW, 

aEVro 

0 型 文法 也 称 为 短语 文法 ， 其 功能 相当 于 图 灵机 ， 任 何 0 型 语言 都 是 递归 可 枚 举 的 ; 反之 ， 
递归 可 枚 举 集 也 必定 是 一 个 0 型 语言 。1 型 文法 也 称 为 上 下 文 有 关 文 法 ， 这 种 文法 意味 着 对 非 
终结 符 的 替换 必须 考虑 上 下 文 ， 并 且 一 般 不 允许 蔡 换 成 = 串 。 例 如 ， 若 a4B 一 ayB 是 1 型 文法 
的 产生 式 , a 和 有 不 全 为 空 , 则 非 终结 符 4 只 有 在 左边 是 a, 右边 是 的 上 下 文中 才能 替换 成 y。 
2 型 文法 就 是 上 下 文 无 关 文 法 ， 非 终结 符 的 替换 无 须 考 虑 上 下 文 。3 型 文法 等 价 于 正规 式 ， 因 此 
也 被 称 为 正规 文法 或 线性 文法 。 

(3) 句子 和 语言 。 设 有 文法 G=(Viy, Vi, P, 5S ) 

。 ”推导 与 直接 推导 : 推导 就 是 从 文法 的 开始 符号 S 出 发 ， 反 复 使 用 产生 式 ， 将 产生 式 左 
部 的 非 终结 符 蔡 换 为 右 部 的 文法 符号 序列 〈 展 开 产 生 式 用 之 表示 )， 直 到 产生 一 个 终 
结 符 的 序列 时 为 止 。 若 有 产生 式 w -> Be 了 P,y,5 eV*”， 则 ya26 忆 1B6 称 为 文法 G 中 的 
一 个 直接 推导 ， 并 称 xx 可 直接 推导 出 705 。 显 然 ， 对 于 了 中 的 每 一 个 产生 式 c 一 P 
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都 有 4 过 B 。 若 在 文法 中 存在 一 个 直接 推导 序列 , 即 m 了 之 吧 了 人 >0)， 


则 称 co 可 推导 出 @%, ,0% 是 的 一 个 推导 ， 并 为 四 二 .用 记 导 a 表示 @% = 


G 


+ 


或 者 @0 寺 0% 。 


G 


直接 归 约 和 归 约 〈 推 导 的 逆 过 程 ): 若 文 法 G 中 有 一 个 直接 推导 % 之 B， 则 称 B 可 直 


四 


接 归 约 成 4, 或 a 是 的 一 个 直接 归 约 。 若 文法 G 中 有 一 个 推导 /一 9 ， 则 称 5 可 归 
G 


约 成 Y， 或 Y 是 56 的 一 个 归 约 。 
句 型 和 句子 : 若 文法 G 的 开始 符号 为 S， 那 么 ， 从 开始 符号 S 能 推导 出 的 符号 串 称 为 


文法 的 一 个 句 型 ， 即 a 是 文法 G 的 一 个 名 型， 当 且 仅 当 存在 推导 S= wae 玉 。 若 愉 
G 


是 文法 G 的 一 个 句 型 ， 且 于 e 玉 "， 则 称 义 是 文法 G 的 一 个 句子 ， 即 仅 含 终结 符 的 句 
型 是 一 个 句子 。 

语言 : 从 文法 G 的 开始 符号 出 发 , 能 推导 出 的 句子 的 全 体 称 为 文法 G 产生 的 语言 , 记 
为 L(G)。 


(4) 文法 的 等 价 。 若 文法 G 与 文法 G, 产生 的 语言 相同 ， 即 Z(G)=L(G,) ， 则 称 这 两 个 文 
法 是 等 价 的 。 


3. 词法 分 析 


语言 中 具有 独立 含义 的 最 小 语法 单位 是 符号 (单词 )， 如 标识 符 、 无 符号 常数 与 界限 符 等 。 
词法 分 析 的 任务 是 把 构成 源 程序 的 字符 串 转换 成 单词 符号 序列 。 词 法 规则 可 用 3 型 文法 (正规 
文法 ) 或 正规 表达 式 描 述 ， 它 产生 的 集合 是 语言 基本 字符 集 汪 (字母 表 ) 上 的 字符 串 的 一 个 子 
集 ， 称 为 正规 集 。 

1) 正规 表达 式 和 正规 集 

对 于 字母 表 己 ， 其 上 的 正规 式 及 其 表示 的 正规 集 可 以 递归 定义 如 下 。 

(1) 是 一 个 正规 式 ， 它 表示 集合 L(e)= {s}。 

(2) 若 a 是 上 的 字符 ， 则 a 是 一 个 正规 式 ， 它 所 表示 的 正规 集 为 {a}。 

(3) 若 正 规 式 + 和 s 分 别 表示 正规 集 LG) 和 Zs)， 则 : 

Q@ 小 是 正规 式 ， 表 示 和 集合 L(7) UL(s)。 

@ ”"s 是 正规 式 ， 表 示 集 合 L(7)L(s)。 
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@ ”是 正规 式 ， 表 示 集 合 (CCD) 。 

@ () 是 正规 式 ， 表 示 集 合 L(7)。 

仅 通 过 有 限 次 地 使 用 上 述 3 个 步骤 定义 的 表达 式 才 是 工 上 的 正规 式 ， 其 中 ， 运 算 符 “|” 
“。” 和 “*?” 分 别称 为 “或 ?“ 连 接 ” 和 “ 闭 包 ”。 在 正规 式 的 书写 中 ， 连 接 运算 符 “。 ”可 
省 略 。 运 算 符 的 优先 级 从 高 到 低 顺序 排列 为 “*”“。”“| ”。 

设 ={a,b}， 表 2-1 列 出 了 三 上 的 一 些 正规 式 和 相应 的 正规 集 。 


表 2-1 正规 式 与 正规 集 示例 


正 规 集 
AD 字符 串 ab 构成 的 集合 
alp 字符 串 a、5 构成 的 集合 
a 由 0 个 或 多 个 a 构成 的 字符 申 集合 
(alp)” 所 有 字符 a 和 5b 构成 的 串 的 集合 
a(alp)” 以 a 为 首 字符 的 a、5b 字符 串 的 集合 
(alb)” abb 


以 abb 结尾 的 a、5b 字符 串 的 集合 
若 两 个 正规 式 表示 的 正规 集 相同 , 则 认为 两 者 等 价 。 两 个 等 价 的 正规 式 U 和 六 记 为 U=V。 


例如 ，b(ab)” 二 (ba) b，(alb) = 二 (a™b”))。 设 U、 六 和 W 均 为 正规 式 ， 正 规 式 的 代数 性 质 如 表 2-2 


表 2-2 正规 式 的 代数 性 质 


UV=7U (UDW= UCVW) 
(UNIW UV IW eU=Ue=U 
UVIW= UV OW V= (Vle) 
(UDW= UWIVW 天 = 六 


2) 有 限 自动 机 

有 限 自 动机 是 一 种 识别 装置 的 抽象 概念 ， 它 能 准确 地 识别 正规 集 。 有 限 自动 机 分 为 两 类 : 
确定 的 有 限 自动 机 和 不 确定 的 有 限 自动 机 。 

(1) 确定 的 有 限 自动 机 (Deterministic Finite Automata，DFA )。 一 个 确定 的 有 限 自动 机 是 
个 五 元 组 (5S,5,fso,Z)， 其 中 : 

。 3 是 一 个 有 限 集 ， 其 每 个 元 素 称 为 一 个 状态 。 

e 三 是 一 个 有 穷 字母 表 ， 其 每 个 元 素 称 为 一 个 输入 字符 。 

e f 是 SXz->S 上 的 单 值 部 分 映像 。f (4.q)=Q 表示 当前 状态 为 4、 输 入 为 a 时 ， 将 转换 

到 下 一 状态 O， 称 2 为 4 的 一 个 后 继 状 态 。 
。 soES， 是 唯一 的 一 个 开始 状态 。 
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。 Z 是 非 空 的 终止 状态 集合 ，Z SS 。 

一 个 DFA 可 以 用 两 种 直观 的 方式 表示 : 状态 转换 图 和 状态 转换 矩阵 。 状 态 转换 图 简称 为 
转换 图 ， 是 一 个 有 向 图 。DFA 中 的 每 个 状态 对 应 转换 图 中 的 一 个 结 点 ,DFA 中 的 每 个 转换 函数 
对 应 图 中 的 一 条 有 向 弧 ， 若 转换 函数 为 A4,a)=Q， 则 该 有 向 弧 从 结 点 4 出 发 ， 进 入 结 点 O， 字 
符 a 是 弧 上 的 标记 。 

【 例 2.1】 已 知 有 DFA MI1= ({so,s1, sz2,s3}，{a,b},，f，so，{s3})， 其 中 了 为 : 

Mso.a)=s1, Aso,b)=s2, fs1,9)= s3, Ns1,b)=s2, fs2,a)= s1, fs2,b)= 53, fs3,a)= 53 

与 DFA M1 对 应 的 状态 图 如 图 2-7 (a) 所 示 ， 其 中 ， 双 圈 表 示 的 结 点 是 终 态 结 点 。 状 态 转 
换 矩 阵 可 以 用 一 个 二 维 数 组 M 表示, 矩阵 元 素 ML4,a] 的 行 下 标 表示 状态 , 列 下 标 表 示 输 入 字符 ， 
ML4.a] 的 值 是 当前 状态 为 4、 输 入 为 a 时 应 转换 到 的 下 一 状态 。 与 DFA MI1 对 应 的 状态 转换 矩 
阵 如 图 2-7 (b) 所 示 。 在 转换 矩阵 中 ， 一 般 以 第 一 行 的 行 下 标 所 对 应 的 状态 作为 初 态 ， 而 终 态 
则 需要 特别 指明 。 


(a) 状态 转换 图 (b) 状态 转换 矩阵 
图 2-7 DFA 的 状态 转换 图 和 转换 矩阵 


对 于 世 中 的 任何 字符 串 w， 若 存在 一 条 从 初 态 结 点 到 某 一 终止 状态 结 点 的 路 径 ， 且 这 条 路 
径 上 所 有 弧 的 标记 符 连 接 成 的 字符 串 等 于 w， 则 称 wo 可 由 DEFA M 识别 (接受 或 读 出 )。 若 一 个 
DFA M 的 初 态 结 点 同时 又 是 终 态 结 点 ， 则 空 字 s 可 由 该 DFA 识别 (或 接受 )。DFA M 所 能 识别 
的 语言 ZQO= { ol wo 是 从 M 的 初 态 到 终 态 的 路 径 上 的 弧 上 标记 所 形成 的 串 }。 

上 的 一 个 字符 串 集合 是 正规 的 ， 当 且 仅 当 存 在 上 的 一 个 DFA M,， 且 天 LM)。 

(2) 不 确定 的 有 限 自动 机 (Nondeterministic Finite Automata，NFA )。 一 个 不 确定 的 有 限 自 
动机 也 是 一 个 五 元 组 ， 它 与 确定 的 有 限 自动 机 的 区 别 如 下 。 

@f 是 SX 一 2 上 的 映像 。 对 于 5 中 的 一 个 给 定 状态 及 输入 符号 , 返回 一 个 状态 的 集合 。 
即 当前 状态 的 后 继 状 态 不 一 定 是 唯一 的 。 

@ 有 向 弧 上 的 标记 可 以 是 e。 
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【 例 2.2】 已 知 有 NFA M2=({s0, $1, $2, $53}, {a,b}, fso, {53}), 其 中 为: 


Jso.a) 一 so， fsoa)=s1, fs0.b)= so fs1,b)= ss fs2,b)=s3 
与 NFA M2 对 应 的 状态 转换 图 和 状态 转换 矩阵 如 图 2-8 所 示 。 


-O00*© 


(a) 状态 转换 图 (b) 状态 转换 矩阵 
图 2-8 ”NFA 的 状态 转换 图 和 转换 矩阵 


显然 , DFA 是 NFA 的 特例 。 实际 上 , 对 于 每 个 NFA M, 都 存在 一 个 DFA NN, 且 LM)=L(N)。 

对 于 任何 两 个 有 限 自动 机 M1 和 M2， 如 果 IM1)=LM2)， 则 称 MI 和 M2 是 等 价 的 。 

3) NFA 到 DFA 的 转换 

任何 一 个 NFA 都 可 以 转换 为 DFA， 下 面 先 定义 转换 过 程 中 需要 的 计算 。 

(1) 车 I 是 NFA M 的 状态 集合 的 一 个 子 集 ， 定 义 e_CLOSURE(D 如 下 。 

。 状态 集 I 的 s_CLOSUREGD 是 一 个 状态 集 。 

。 ”状态 集 I 的 所 有 状态 属于 se_CLOSURE(D。 

。 若 sEI， 那 么 从 s 出 发 经 过 任意 条 s 弧 到 达 的 状态 s' 都 属于 s_ CLOSURE(D。 

状态 集 。_CLOSURECD 称 为 了 7 的 = 闭 包 。 

由 以 上 的 定义 可 知 , 了 的 s_ 闭 包 就 是 从 状态 集 工 的 状态 出 发 ， 经 s 所 能 到 达 的 状态 的 全 体 。 

假定 7 是 NFA M 的 状态 集 的 一 个 子 集 ，a 是 三 中 的 一 个 字符 ， 定 义 ; 

Li=s_CLOSURE() 

其 中 ，J 是 那些 可 从 了 中 的 某 一 状态 结 点 出 发 经 过 一 条 a 弧 而 到 达 的 状态 结 点 的 全 体 。 

在 定义 了 。_CLOSURE 后 ， 就 可 以 用 子 集 法 将 一 个 NFA 转换 为 一 个 DFA。 

(2) NFA 转换 为 DFA。 设 NFA M=(S, ,了 so Z )， 与 之 等 价 的 DFA N=(S' ,了 /’, go 2Z')， 
用 子 集 法 将 非 确 定 的 有 限 自 动机 确定 化 的 算法 步骤 如 下 。 

四 求 出 DFANN 的 初 态 go， 即 令 go=e_CLOSURE({so})， 此 时 S' 仅 含 初 态 go， 且 没有 标记 。 

@ 对 于 5 中 尚未 标记 的 状态 g; = {352,… ,sim},sy eS(j =1,…,m) 进行 以 下 处 理 。 

。 标记 gq;， 以 说 明 该 状态 已 经 计算 过 。 

。 ”对 于 每 个 ae, 令 Tf (fs ,Sin} ,9)，4j; =£_CLOSURE(7T)。 

。 若 gj 不 在 5S 中 ， 则 将 qj 作为 一 个 未 加 标记 的 新 状态 添加 到 S'， 同 时 把 状态 转换 函数 
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fqi,9 厂 qj 添加 到 DFAM 中 。 
@ 重复 进行 步骤 @@， 直 到 S$' 中 不 再 有 未 标记 的 状态 时 为 止 。 
@ 邻 Z={glgeS'HgNZzD。 
【 例 2.3】 已 知 一 个 识别 正规 式 ab*a 的 非 确定 有 限 自动 机 ， 其 状态 转换 图 如 图 2-9 所 示 ， 
用 子 集 法 将 其 转换 为 DFA N。 


图 2-9 ab*a 的 NFA 状态 转换 图 


根据 s_CLOSURE 的 定义 ,可 以 求 出 a CLOSURE({0})={0}, 将 {0} 记 为 DFA 的 初 态 go。 
然后 根据 题 中 所 给 的 状态 转换 图 以 及 算法 步骤 @ 求 解 DFANN 的 各 个 状态 的 过 程 如 下 。 

5_CLOSURE(qo,.a)={1,2,4}， 将 {1,2.4} 记 为 q1; s_CLOSURE(qo,b)= 人 }， 标 记 qo。 

s_CLOSURE(q1,a)={5}， 将 {5} 记 为 gq。( 终 态 )。 

s_CLOSURE(q1,6)={2,3,4}， 将 {2,3,4} 记 为 g3， 标 记 qi。 

6_CLOSURE(q;»,a)={}，s_CLOSURE(gq2,b)={}， 标 记 q,。 

s_ CLOSURE(g3,a)={5}, B] qz。 

s_CLOSURE(q3,6)={2,3,4}， 即 qs， 标记 qs。 

当 5S' 中 不 再 有 未 标记 的 状态 时 ， 算 法 即 可 终止 ， 所 得 的 DFAN 如 图 2-10 所 示 。 

4) DFA 的 最 小 化 

从 NFA 转换 得 到 的 DFA 不 一 定 是 最 简化 的 ， 可 以 通过 等 价 变换 将 DFA 进行 最 小 化 处 理 。 

对 于 有 限 自动 机 中 的 任何 两 个 状态 ! 和 s， 若 从 其 中 一 个 状态 出 发 接受 输入 字符 串 o， 而 
从 另 一 状态 出 发 不 接受 w， 或 者 从 + 和 s 出 发 到 达 不 同 的 接受 状态 ， 则 称 w 对 状态 s 和 + 是 可 
区 分 的 。 若 状态 s 和 + 不 可 区 分 ， 则 称 其 为 可 以 合并 的 等 价 状态 。 

对 图 2-10 所 示 的 自动 机 进行 化 简 所 得 的 DFA 如 图 2-11 所 示 。 


b 


图 2-10 识别 ab*a 的 DFA 示意 图 图 2-11 识别 ab*a 的 最 小 化 DFA 示意 图 
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4. 正规 式 与 有 限 自 动机 之 间 的 转换 


1) 有 限 自动 机 转换 为 正规 式 

对 于 三 上 的 NFA M， 可 以 构造 一 个 王 上 的 正规 式 R， 使 得 L(R)=L0M)。 

拓 广 状态 转换 图 的 概念 ， 令 每 条 弧 可 用 一 个 正规 式 作 标记 ,为 上 的 NFA M 构造 相应 的 
正规 式 R， 分 为 如 下 两 步 。 

(1) 在 MM 的 状态 转换 图 中 加 两 个 结 点 ， 一 个 x 结 点 ,一 个 y 结 点 。 从 x 结 点 到 NFA M 的 
初始 状态 结 点 引 一 条 弧 并 用 标记， 从 NFA M 的 所 有 终 态 结 点 到 yy 结 点 引 一 条 弧 并 用 = 标记。 
形成 一 个 与 M 等 价 的 M'"，M' 只 有 一 个 初 态 x 和 一 个 终 态 y。 

(2) 按 下 面 的 方法 逐步 消去 M' 中 除 x 和 y 的 所 有 结 点 。 在 消除 结 点 的 过 程 中 , 用 正规 式 来 
标记 弧 ， 最 后 结 点 x 和 y 之 间 弧 上 的 标记 就 是 所 求 的 正规 式 。 消 除 结 点 的 规则 如 图 2-12 所 示 。 


对 于 CT) RI Q) R, G) 代 之 以 ©@ RiR; G) 
R 
sr OT AD rzu DM -G 
Ra 
玉 


对 于 a 9 KZ (DRE (3) 


图 2-12 有 限 自 动机 到 正规 式 的 转换 规则 示意 图 


2) 正规 式 转换 为 有 限 自 动机 
同样 ， 对 于 三 上 的 每 个 正规 式 R， 可 以 构造 一 个 上 的 NFA M， 使 得 LM)=L(R)。 


(1) 对 于 正规 式 R， 可 用 图 2-13 所 示 的 拓 广 状态 图 表示 。 
(2) 通过 对 正规 式 R 进行 分 裂 并 加 入 新 的 结 点 ， 逐 步 把 图 —O 

转变 成 每 条 弧 上 的 标记 是 于 上 的 一 个 字符 或 es， 转换 规则 如 图 

2-14 所 示 。 图 2-13 拓 广 状态 图 


对 于 CC) RR OQ) 代 之 以 人 RI @ R, Q) 
RI 

和 OO 
R; 


R 


图 2-14 ”正规 式 到 有 限 自 动机 的 转换 规则 示意 图 
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最 后 所 得 的 图 即 为 一 个 NFA M，x 为 初 态 结 点 ，) 为 终 态 结 点 。 显 然 ，L@M)=L(R)。 
5. 词法 分 析 器 的 构造 


有 了 正规 式 和 有 限 自动 机 的 理论 基础 后 ， 就 可 以 构造 出 编译 程序 的 词法 分 析 模 块 。 构 造 词 
法 分 析 器 的 一 般 步 骤 如 下 。 

(1) 用 正规 式 描述 语言 中 的 单词 构成 规则 。 

(2) 为 每 个 正规 式 构造 一 个 NFA， 它 识别 正规 式 所 表示 的 正规 集 。 

(3) 将 构造 出 的 NFA 转换 成 等 价 的 DFA。 

(4) 对 DFA 进行 最 小 化 处 理 ， 使 其 最 简 。 

(5) 从 DFA 构造 词法 分 析 器 。 


6. 语法 分 析 


语法 分 析 的 任务 是 根据 语言 的 语法 规则 分 析 单 词 串 是 否 构 成 短语 和 句子 ， 即 表达 式 、 语 句 
和 程序 等 基本 语言 结构 ， 同 时 检查 和 处 理 程序 中 的 语法 错误 。 程 序 设计 语言 的 绝 大 多 数 语法 规 
则 可 以 采用 上 下 文 无 关 文法 进行 描述 。 语 法 分 析 方 法 有 多 种 ， 根 据 产生 语法 树 的 方向 ， 可 分 为 
自 底 向 上 和 自 顶 向 下 两 类 。 

1) 上 下 文 无 关 文 法 

上 下 文 无 关 文 法 属于 乔 姆 斯 基 定 义 的 2 型 文法 , 被 广泛 地 用 于 表示 各 种 程序 设计 语言 的 语 
法 规则 。 对 于 上 下 文 无 关 文 法 ，G[S]=(Viw, Vr, P, S)， 其 产生 式 的 形式 都 是 4 一 Bp， 其 中 4 EV 
pe Uy 

若 不 加 特别 说 明 ， 下 面 用 大 写 英文 字母 4、B、C 等 表示 非 终 结 符 ， 小 写 英文 字母 a、b、c 
等 表示 终结 符号 ，u、v、w 等 表示 终结 符号 串 ， 小 写 希 腊 字 母 a、B、y、6 等 表示 终结 符 和 非 终 
结 符 混合 的 文法 符号 串 。 由 于 一 个 上 下 文 无 关 文法 的 核心 部 分 是 其 产生 式 集 合 ， 所 以 文法 可 以 
简写 为 其 产生 式 集合 的 描述 形式 。 

(1) 规范 推导 (最 右 推 导 )。 如 果 在 推导 的 任何 一 步 a = Bp (其 中 a、B 是 句 型 )， 都 是 对 
a 中 的 最 右 ( 最 左 ) 非 终结 符 进行 替换 ， 则 称 这 种 推导 为 最 右 ( 最 左 ) 推导 。 最 右 推 导 常 称 为 
规范 推导 。 

(2) 短语 、 直 接 短语 和 句柄 。 设 a56 是 文法 G 的 一 个 句 型 ， 即 SSasp, 且 满足 S 一 ad4p 


和 4 之 5 ， 则 称 5 是 名 型 w68 相对 于 非 终结 符 4 的 短语 。 特 别 地 ， 如 果 有 4 -> 5 ， 则 称 5 是 名 
型 g68 相对 于 产生 式 4 一 6 的 直接 短语 。 一 个 句 型 的 最 左 直接 短语 称 为 该 句 型 的 句柄 。 
【 例 2.4】 对 于 简单 算术 表达 式 ， 可 以 用 下 面 的 文法 G[ 本 进行 描述 。 
GIE]=({E,TF},{+,*,()id }, 7, DB) 


加 :加 
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P={E>IED TF, FDld} 

可 以 证 明 ，idtid*id 是 该 文法 的 句子 。 下 面 用 最 右 推导 的 方式 从 文法 的 开始 符号 出 发 推导 
出 该 句子。 为 了 表示 推导 过 程 中 相同 符号 的 不 同 出 现 ， 给 符号 加 一 个 下 标 。 

EE+TOE+D*RED+L*id B+h*id, = E+id,*id, 

SB+id,*id = E+tid,*id, = id, tid, *ids 

该 推导 过 程 可 以 用 树 型 结构 进行 描述 ， 如 图 2-15 所 示 。 


BS E 一 E 一 E 一 E 
/NN TS pa 人 
BE + 7 BE + 7 E + 1 BE + 7 
pd EA 一 以 
LT 时 a TD | 到 到 三 
| | | 
ids 严 idy 
坊 放 => 和 > 和 => 个 
MA 人 | 人 人 
BE + 7 卫 二 ”而 E + TT 局 + 也 
A 人 八 | ON | AS | 人 
TB * hn 加， 各 素 ，: 汤 瑟瑟 加 EE 
| | | | | | | | | 
已 大 已 id: FE i FF i 
| | | | | 
id: 这 过 idl id 


图 2-15 推导 过 程 示意 图 


由 于 过 + *idy， 且 这 j4,， 所 以 记 是 句 型 Eitid*ig 的 相对 于 非 终结 符 了 的 短语 。 

由 于 才思 +i4,*id)， 且 太 过 id ， 所 以 jt 是 句 型 训 *idstids 相 对 于 非 终结 符 F 的 短语 ， 
也 是 相对 于 产生 式 一 jg 的 直接 短语 。 

由 于 EE 过 +， 且 T 性 jd,*ig， 所 以 yx*id 是 句 型 Eitids*id 的 相对 于 非 终结 符 7 的 
短语 。 

由 于 E 坊 i *id, + ， 所 以 ji*idytids 是 句 型 jd1*idytids 的 相对 于 非 终结 符 的 短语 。 
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实际 上 ，id1，iqd,，id;，id1*id, 和 idu*idytid 都 是 句 型 id1*idytid; 的 短语 ,而且 idi, id,, ids 
均 是 直接 短语 ， 其 中 id 是 最 左 直接 短语 ， 即 句柄 。 

2) 自 顶 向 下 语法 分 析 方 法 

自 顶 向 下 〈 或 自 上 而 下 ) 分 析 法 的 基本 思想 是 : 对 于 给 定 的 输入 串 @， 从 文法 的 开始 符号 
S 出 发 进行 最 左 推导 ， 直 到 得 到 一 个 合法 的 句子 或 者 发 现 一 个 非法 结构 。 在 推导 的 过 程 中 试图 
用 一 切 可 能 的 方法 ， 自 上 而 下 、 从 左 到 右 地 为 输入 串 w 建立 语法 树 。 整 个 分 析 过 程 是 一 个 试探 
的 过 程 ， 是 反复 使 用 不 同 产生 式 谋求 与 输入 序列 匹配 的 过 程 。 若 输入 串 是 给 定 文法 的 句子 ， 则 
必 能 成 功 ， 反 之 必然 出 错 。 

当 文法 中 存在 下 述 产 生 式 时 ， 在 自 项 向 下 分 析 过 程 中 会 出 现下 面 的 问题 。 

(1) 若 文法 中 存在 形 如 4 一 a8|a6 的 产生 式 ， 即 4 产生 式 中 有 多 于 一 个 候选 项 的 前 绷 相 
同 〈 称 为 公共 左 因子 ， 简 称 左 因 子 )， 则 可 能 导致 分 析 过 程 中 的 回溯 处 理 。 

(2) 若 文法 中 存在 形 如 4 一 4 a 的 产生 式 ， 由 于 采取 了 最 左 推导 ， 可 能 会 造成 分 析 过 程 陷 
入 死 循环 的 情况 ， 产 生 式 的 这 种 形式 被 称 为 左 递归 。 

因此 ， 需 要 对 文法 进行 改造 ， 消 除 其 中 的 左 递归 ， 以 避免 分 析 陷 入 死 循 环 ， 提取 左 因子 ， 
以 避免 回溯 。 

(1) 消除 文法 的 左 递归 。 

@ 消除 直接 左 递归 。 一 般 而 言 ， 假 定 非 终结 符号 4 的 产生 式 为 4 一 Aa|B， 其 中 ，a 不 
等 于 s，p 不 以 4 开头 ， 那 么 就 对 4 的 产生 式 进行 如 下 的 改造 : 

A— pA' 
A'—ad'le 

由 于 4 过 da 全 Ba"， 可 知 改造 前 后 关于 4 的 产生 式 是 等 价 的 。 将 上 述 结果 推广 到 更 一 般 

的 情况 : 先 将 非 终 结 符 4 的 产生 式 整 理 为 如 下 形式 。 
A>Aa |Am1*…|Aon |B 1B,1…|B, 

其 中 ，a(1<i< m) 都 不 等 于 s，pB,(1<j<n) 都 不 以 4 开头 , 然后 用 “4 一 B4'|P,4"1…|p,4' 
和 4' 一 oq4'|ay4'|…|a4'lse ”代替 4 产生 式 。 

@ 消除 文法 中 的 一 切 左 递归 。 消 除 文法 中 所 有 左 递归 的 方法 是 : 对 产生 式 的 右 部 进行 代 
换 ， 将 所 有 的 非 直 接 左 递归 产生 式 改造 为 直接 的 左 递归 产生 式 ， 然 后 消除 文法 中 的 直接 左 递归 
产生 式 。 

【 例 2.5】 对 于 文法 GLIE]-({E, 革 也 , 由 0) 二, 己 司 

P={E 一 TIE+T, THIT*F,F 一 (lid}， 消 除 左 递归 后 的 文法 为 : 

OEE(E .LTT 
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P'= {ETE' E>+7TE's, TFT TY 一 *FTe F—(P)lid} 
(2) 提取 公共 左 因子 。 假 定 关于 4 的 产生 式 为 4 ap |apB,1…|ap,， 那 么 称 a 为 4 的 候 
选 式 的 公共 左 因子 (简称 左 因子 )。 如 果 4 的 产生 式 有 左 因子 ， 在 推导 过 程 中 会 出 现 无 法 确定 
用 4 产生 式 的 哪个 候选 式 替 换 4 的 情况 , 这 时 可 以 重 写 4 产生 式 来 推迟 这 种 决定 , 直到 看 见 足 
够 的 输入 ， 能 正确 做 出 选择 时 为 止 ， 因此 可 将 4 的 产生 式 改 为 4 二 a4' 和 4' 一 BB1PB,1…|p。 
经 反复 提取 ， 就 能 使 每 个 非 终 结 符 〈 包 括 新 引进 的 ) 的 任意 两 个 候选 式 不 含有 公共 前 级 。 
(3) LL(1) 文 法 。 一 个 文法 G 是 LL(1) 的 ， 当 且 仅 当 G 的 任何 两 个 产生 式 4 -> cx|0 满足 下 
面 的 条 件 。 
@ 对 于 任何 终结 符 ag，a 和 BB 不 能 同时 推导 出 以 a 开始 的 文法 符号 序列 。 
@ a 和 Bp 最 多 有 一 个 可 以 推导 出 s。 
图 车 p 坊 ae， 则 a 不 能 推导 出 以 FOLLOW(4) 中 的 终结 符 开始 的 任何 文法 符号 序列 。 
下 面 说 明 FIRST(a) 和 FOLLOW(4) 的 含义 。 文 法 符号 序列 a 的 FIRST 集合 ， 就 是 从 a 出 
发 可 以 推导 出 的 所 有 以 终结 符号 开头 的 序列 中 的 开头 终结 符号 构成 的 集合 。 而 一 个 非 终结 符 4 
的 FOLLOW 集合 ， 就 是 从 文法 开始 符号 可 以 推导 出 的 所 有 含 4 名 型 中 紧 跟 在 4 之 后 的 终结 和 
号 构成 的 集合 。 
@ 文法 符号 序列 w 的 FIRST 集合 定义 如 下 : 
FIRST(o = {a| ga HaeV)}, 若 w 过 se 约定 ssFIRST(aw)。 
在 求解 一 个 文法 符号 的 FIRST 集 合 时 ,初始 时 将 每 一 个 文法 符号 XYE VwyU 办 的 FIRSTCD 
阜 空 ， 然 后 应 用 以 下 规则 。 
。 若 XYeVr， 则 将 加 入 FIRST(9)。 
。 若 了 EVWy， 则 考查 其 产生 式 。 
。 若 有 Xs， 则 将 加 入 FIRSTO9)。 
e。 若 有 Xa…， 且 aEVz， 则 将 a 加 入 FIRSTOY)。 
e。 若 有 > 了 … 到, 且 页 人 了 故 , 则 将 FIRST(O5) 中 除 s 之 外 的 所 有 元 素 加 入 FIRSTCO; 
车 五 素 … 工 ， a 则 将 FIRST( 太 中 除 e 之 外 的 所 有 元 素 加 入 FIRSTCD; 特别 地 ， 若 
sEFIRST(7)， 广 1,2…,k， 则 将 =。 加 入 FIRSTCD。 
。 ”反复 执行 以 上 两 步 ， 直 到 每 个 文法 符号 的 FIRST 集合 不 再 扩大 为 止 。 
@ 非 终结 符 4 的 FOLLOW 集合 定义 如 下 : 
FOLLOW(4)- {a15 必 …4a… 目 oe 态 }， 若 4 是 某 个 句 型 的 最 右 符号 ， 则 约定 # 属 于 
FOLLOW(C)。 
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在 求解 一 个 文法 中 非 终结 符 4 的 FOLLOW 集合 时 ， 先 将 FOLLOW(4) 置 空 ， 然 后 应 用 以 
下 规则 。 

。 若 4 是 文法 的 开始 符号 ， 则 将 需 0I 入 FOLLOWCD)，# 是 输入 结束 标记 。 

e。 若 有 产生 式 4 一 aBB ， 则 将 FIRST(P) 中 除 = 之 外 的 所 有 元 素 加 入 FOLLOW(B) 中 。 

。 若 有 产生 式 4 一 aB，, 或 4>xBp 且 seFIRST(O)， 则 将 FOLLOW(C) 中 的 全 体 元 素 

加 入 FOLLOW(B) 中 。 

【 例 2.6】 对 文法 GLIE]({E,E, TT,F,y, {+,*,(,),id),P, 妈 ) 

P= {ETE' E>+TE'e, TFT T'—»*FTe, Fs(E)lid} 

对 于 终结 符号 a， 显 然 FIRST(a)={a}， 所 以 下 面 只 列 出 文法 中 非 终 结 符号 的 FIRST 和 
FOLLOW 集合 的 计算 结果 。 

FIRST(E) = FIRST(D =FIRST(F)= {(,id} FIRST(T)= {*,e} FIRST(E)= {+,e} 

FOLLOW(E) = FOLLOW(E’)= {#,)} FOLLOW(7T)=FOLLOW(T)= {#.),+} 

FOLLOW(F) = {#,),+,* } 

(4) 递归 下 降 分 析 法 。 递 归 下 降 分 析 法 要 求 文法 是 LL(1) 文 法 ， 它 直接 以 子 程序 调用 的 方 
式 模拟 产生 语言 的 过 程 ， 其 基本 思想 是 : 为 每 一 个 非 终 结 符 构造 一 个 子 程序 ， 每 个 子 程序 的 过 
程 体 按 该 产生 式 候选 项 分 情况 展开 ， 遇 到 终结 符 即 进行 匹配 ， 而 遇 到 非 终结 符 则 调用 相应 的 子 
程序 。 该 分 析 法 从 调用 文法 开始 符号 的 子 程序 开始 ， 直 到 所 有 非 终 结 符 都 展开 为 终结 符 并 得 到 
匹配 为 止 。 车 分 析 过 程 可 以 达到 这 一 步 ， 则 


表明 分 析 成 功 , 否则 表明 输入 品 中 有 语法 错 输入 符号 曲 
误 。 递 归 下 降 分 析 法 的 优点 是 简单 且 易 于 构 | ts 
造 , 缺点 是 程序 与 文法 直接 相关 ,对 文法 的 。， 条 出 
任何 改变 都 需要 在 程序 中 进行 相应 的 修改 。 pe 
(5) 预测 分 析 法 。 预 测 分 析 法 是 另 一 号 | 
种 自 项 向 下 的 分 析 方法 ， 其 基本 模型 如 图 i 
2-16 所 示 。 分 析 表 
一 个 LL(1) 文 法 的 预测 分 析 表 可 以 用 图 2-16 ”预测 分 析 模 型 示意 图 


一 个 二 维 数 组 M 表示 ， 其 元 素 ML4,a](4E 
VW，aEVrU 搬 存放 关于 4 的 产生 式 ， 表 明 当 遇 到 输入 符号 为 a 且 用 4 进行 推导 时 所 应 采用 的 
产生 式 ; 若 ML4,a] 为 eror， 则 表明 推导 时 遇 到 了 不 该 出 现 的 符号 ， 应 进行 出 错 处 理 。 构 造 一 个 
文法 的 预测 分 析 表 的 过 程 如 下 。 

Q@ 对 文法 的 每 个 产生 式 4 一 & ， 执 行 @ 和 @)。 

@ 对 FIRST(&) 的 每 个 终结 符 a， 加 入 4 一 & 到 M[4.a]。 
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@ 着 sEFIRST(&), 则 对 FOLLOW(4) 的 每 个 终结 符 5 (包括 #), 加 入 4 一 & 到 M[4,5] 中 。 

四 M 中 其 他 没有 定义 的 条 目 置 为 error。 

预测 分 析 法 的 工作 过 程 是 : 初始 时 ， 将 “#” 和 文法 的 开始 符号 压 入 栈 中 ; 在 分 析 过 程 中 ， 
根据 输入 串 中 的 当前 输入 符号 a 和 当前 的 栈 项 符号 下 进行 处 理 。 

车 于 =a = 类 ， 则 分 析 成 功 ， 车 革 = 党 且 a 到 过 ， 则 出 错 。 

车 XeEVr 且 了 =a， 则 于 退 栈 ， 并 读 入 下 一 个 符号 a; 车 Xe 六 上 且 司 a， 则 出 错 。 

若 XEWVwy 且 MLX.aj='4 一 a'， 则 革 退 栈 ，a 中 的 符号 从 右 到 左 依次 进 栈 (s 无 须 进 栈 ); 若 
MILX.a]='error， 则 调用 出 错 程序 进行 处 理 。 

根据 文法 G[E]={E 一 TEE 一 +7TE1s,TFT,T 一 *FT1e,F 一 ( 妨 id} 构 造 的 预测 分 析 表 为 : 


[= we | | | | | 
zs [am | | | | | 
z | jp | | so | so 
| | | | mr | 
F 


| we | mmr Oe | 
| wa | | Te] | 

3) 自 底 向 上 语法 分 析 方 法 

自 底 向 上 分 析 方 法 也 称 移 进 - 归 约 分 析 


Sp -一 | 


法 ,工作 模型 如 图 2-17 所 示 。 其 基本 思想 是 2 
对 输入 序列 w 自 左 向 右 进行 扫描 ， 并 将 输入 | 
符号 逐个 移 进 一 个 栈 中 ， 边 移 进 边 分 析 ， 一 - 


且 栈 顶 符号 串 形 成 某 个 句 型 的 可 归 约 串 ， 就 
用 某 个 产生 式 的 左 部 非 终结 符 来 蔡 代 ， 这 称 
为 一 步 归 约 。 重 复 这 一 过 程 ， 直 至 栈 中 只 剩 
下 文法 的 开始 符号 且 输入 串 也 被 扫描 完 时 为 
止 , 确认 输入 串 w 是 文法 的 句子 ， 表明 分 析 
成 功 ， 否 则 ， 进 行 出 错 处 理 。 图 2-17 移 进 - 归 约 分 析 模型 

移 进 - 归 约 分 析 法 的 数学 模型 是 下 推 自 
动机 。 若 模型 中 采用 算 符 优先 分 析 表 ， 用 “最 左 素 短语 ”来 刻画 “可 归 约 串 ” 则 相应 的 分 析 
器 称 为 算 符 优先 分 析 器 ; 若 采用 LR 分 析 表 ， 用 “句柄 ”来 刻画 “可 归 约 串 ”， 则 相应 的 分 析 器 
称 为 LR 分 析 器 。 

LR 分 析 法 是 一 种 规范 归 约 分 析 法 。 规 范 归 约 是 规范 推导 (最 右 推 导 ) 的 逆 过 程 ， 下 面 举例 


移 进 一 归 约 
分 析 表 
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说 明 规范 归 约 的 过 程 。 
【 例 2.7】 设 文法 GISj-{S 一 aAcBe,A 一 b.A 一 Ab.B 一 dj， 下 面 对 输 入 串 #abbcde# (# 为 开始 
和 结束 标志 符号 ) 进行 分 析 。 先 设 一 个 符号 栈 ， 并 把 句子 左 括号 “#” 放 入 栈 底 ， 其 分 析 过 程 


如 下 。 
步骤 符号 栈 输入 符号 串 动作 
C1 # abbcde# 移 进 
(2) #a bbcde# 移 进 
(3) #ab bcde# 归 约 (A 一 b) 
(4) #aA bcde# 移 进 
(5) #aAb cde# 归 约 (A 一 Ab) 
(6) #aA cde# 移 进 
(7) #aAc de# 移 进 
(8) #aAcd e# 归 约 (B 一 d) 
(9) #aAcB e# 移 进 
(10) #aAcBe # 归 约 (S 一 aAcBe) 
(11) #5S # 接受 


说 明 : 在 第 (3) 步 中 栈 项 符号 串 b 是 句 型 abbcde 的 句柄 ， 用 产生 式 A 一 b 进行 归 约 ;第 
(5) 步 中 Ab 是 句 型 aAbcde 的 句柄 ， 用 相应 产生 式 A 一 Ab 进行 归 约 ; 第 (8) 步 和 第 (10) 步 
是 同样 的 道理 。 上 述 分 析 过 程 也 可 看 成 是 自 底 向 上 构造 语法 树 的 过 程 。 

LR 分 析 法 根据 当前 分 析 栈 中 的 符号 串 〈 通 常 以 状态 表示 ) 和 向 右 顺 序 查看 输入 串 的 大 个 
(人 20) 符号 ， 就 可 唯一 确定 分 析 器 的 动作 是 移 进 还 是 归 约 ， 以 及 用 哪 条 产生 式 进行 归 约 ， 因 而 
也 就 能 唯一 地 确定 句柄 。 当 大 1 时 ， 已 能 满足 当前 绝 大 多 数 语言 的 分 析 要 求 。 常 用 的 LR 分 析 
器 有 LR(0)、SLR(1)、LALR(1) 和 LR(1)。 

一 个 LR 分 析 器 由 如 下 3 个 部 分 组 成 。 

(1) 驱动 器 。 驱 动 器 或 称 驱动 程序 。 对 于 所 有 的 LR 分 析 器 ， 了 驱动 程序 都 是 相同 的 。 

(2) 分 析 表 。 不 同 的 文法 具有 不 同 的 分 析 表 。 当 同一 文法 采用 不 同 的 LR 分 析 器 时 ， 分 析 
表 也 不 同 。 分 析 表 又 可 分 为 动作 表 (ACTION) 和 状态 转换 表 (GOTO) 两 个 部 分 ， 它 们 都 可 
用 二 维 数组 表示 。 

(3) 分 析 栈 。 分 析 栈 包括 文法 符号 栈 和 相应 的 状态 栈 。 

分 析 器 的 动作 由 栈 项 状态 和 当前 输入 符号 决定 (LR(0) 分 析 器 不 需 向 前 查看 输入 符号 ), LR 
分 析 器 的 模型 如 图 2-18 所 示 。 
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输入 a | a | Ee a an | # | 


1 
i 范 So——] 驱动 器 箱 出 
| Sr 人 


| # | sw ACTION 表 GOTO 表 


图 2-18 LR 分 析 器 模型 示意 图 


其 中 ，SP 为 栈 顶 指 针 ，S 为 状态 ， 总 为 文法 符号 。ACTION[S。 a]= 5 规定 了 栈 项 状态 为 % 且 遇 
到 输入 符号 a 时 应 执行 的 动作 。 状 态 转换 表 GOTO[S, 如 =5, 表示 当 状态 栈 项 为 % 且 文 法 符号 栈 
项 为 工时 应 转向 状态 9。 

LR 分 析 器 的 工作 过 程 以 格局 的 变化 来 反映 。 格 局 的 形式 为 :( 栈 ， 剩 余 输入 ， 动 作 )。 分 
析 是 从 某 个 初始 格局 开始 的 ， 经 过 一 系列 的 格局 变化 ， 最 终 达到 接受 格局 ， 表 明 分 析 成 功 ; 或 
者 达到 出 错 格局 , 表明 发 现 一 个 语法 错误 。 因此 ,开始 格局 的 剩余 输入 应 该 是 全 部 的 输入 序列 ， 
而 接受 格局 中 的 剩余 输入 应 该 为 空 ， 任 何其 他 格局 或 者 出 错 格 局 中 的 剩余 输入 应 该 是 全 部 输入 
序列 的 一 个 后 级 。 

在 LR 分 析 过 程 中 ， 改 变 格局 的 动作 有 以 下 4 种 。 

(1) 移 进 (ShifD。 当 ACTION[S, a]=5S 时 ， 把 a 移 进 文法 符号 栈 并 转向 状态 9。 

(2) 归 约 (Reduce)。 当 在 文法 符号 栈 顶 形成 句柄 8 时 ， 把 8 归 约 为 相应 产生 式 4-8 的 非 
终结 符 4。 若 万 的 长 度 为 >〈 即 四 Fr>)， 则 弹出 文法 符号 栈 项 的 > 个 符号 ， 然 后 将 4 压 入 文法 符 
号 栈 中 。 

(3) 接受 《Accept)。 当 文法 符号 栈 中 只 剩 下 文法 的 开始 符号 S$， 并 且 输 入 符号 串 已 经 结束 
时 (当前 输入 符 是 “#”)， 分 析 成 功 。 

(4) 报错 (Emror)。 当 输入 串 中 出 现 不 该 有 的 文法 符号 时 报错 。 

LR 分 析 器 的 核心 部 分 是 分 析 表 的 构造 ， 这 里 不 再 详 述 。 

7 语法 制导 翻译 和 中 间 代码 生成 

程序 设计 语言 的 语义 分 为 静态 语义 和 动态 语义 。 描 述 程序 语义 的 形式 化 方法 主要 有 属性 文 
法 、 公 理 语义 、 操 作 语义 和 指称 语义 等 ， 其 中 ， 属 性 文法 是 对 上 下 文 无 关 文法 的 扩充 。 目 前 应 
用 最 广 的 静态 语义 分 析 方 法 是 语法 制导 翻译 ， 其 基本 思想 是 将 语言 结构 的 语义 以 属性 的 形式 赋 
予 代表 此 结构 的 文法 符号 ， 而 属性 的 计算 以 语义 规则 的 形式 赋予 文法 的 产生 式 。 在 语法 分 析 的 


第 2 章 程序 设计 语言 基础 知识 


推导 或 归 约 的 步骤 中 ， 通 过 执行 语义 规则 实现 对 属性 的 计算 ， 以 达到 对 语义 的 处 理 。 

1) 中 间 代 码 

从 原理 上 讲 ， 对 源 程序 进行 语义 分 析 之 后 就 可 以 直接 生成 目标 代码 ， 但 由 于 源 程序 与 目标 
代码 的 结构 往往 差别 很 大 , 特别 是 考虑 到 具体 机 器 指令 系统 的 特点 , 要 使 翻译 一 次 到 位 很 困难 ， 
而 且 用 语法 制导 方式 机 械 生 成 的 目标 代码 往往 是 烦琐 和 低 效 的 ， 因 此 有 必要 设计 一 种 中 间 代 
码 ， 将 源 程序 首先 翻译 成 中 间 代码 表示 形式 ， 以 利于 进行 与 机 器 无 关 的 优化 处 理 。 由 于 中 间 代 
码 实际 上 也 起 着 编译 器 前 端 和 后 端 分 水 岭 的 作用 ， 所 以 使 用 中 间 代 码 也 有 助 于 提高 编译 程序 的 
可 移植 性 。 常 用 的 中 间 代 码 有 后 级 式 、 三 元 式 、 四 元 式 和 树 等 形式 。 

(1) 后 级 式 〈 逆 波兰 式 )。 北 波兰 式 是 波兰 逻辑 学 家 卢 卡 西 维 奇 发 明 的 一 种 表示 表达 式 的 
方法 。 这 种 表示 方式 把 运算 符 写 在 运算 对 象 的 后 面 ， 例 如 ， 把 atb 写成 ab+， 所 以 也 称 为 后 级 
式 。 这 种 表示 法 的 优点 是 根据 运算 对 象 和 运算 符 的 出 现 次 序 进行 计算 ， 不 需要 使 用 括号 ， 也 便 
于 用 栈 实现 求 值 。 对 于 表达 式 x:=(atb)*(c+d)， 其 后 级 式 为 xabtcd+*:=。 

(2) 树 形 表示 。 例 如 ， 表 达 式 x:=(atb)*(c+d) 的 树 形 表示 为 


x * 
ss 
+ 十 
a b c d 


(3) 三 元 式 表示 。 三 元 式 是 由 运算 符 OP、 第 一 运算 对 象 ARG1 和 第 二 运算 对 象 ARG2 组 
成 的 。 例 如 ， 表 达 式 x:=(atb)*(ctd) 的 三 元 式 表示 为 : 

OD,a,b) @t,cd) OD) (=,@x) 

(4) 四 元 式 表 示 。 四 元 式 是 一 种 普遍 采用 的 中 间 代码 形式 ， 其 组 成 成 分 为 运算 符 OP、 第 
一 运算 对 象 ARG1、 第 二 运算 对 象 ARG2 和 运算 结果 RESULT。 其 中 ， 运 算 对 象 和 运算 结果 有 
时 指 用 户 自 定义 的 变量 ， 有 时 指 编译 程序 引入 的 临时 变量 ，RESULT 总 是 一 个 新 引进 的 临时 变 
量 ， 用 来 存放 运算 结果 。 例 如 ， 表 达 式 x:=(atb)*(c+d) 的 四 元 式 表 示 为 : 

Dt,ab,tl) CHcdD) CHG) Ot3, x) 

2) 常见 语法 结构 的 翻译 

常见 的 语法 结构 主要 有 算术 表达 式 、 布 尔 表达 式 、 赋 值 语句 和 控制 语句 (if、while〉 等 。 
不 同 结构 需要 不 同 的 处 理 方法 ， 但 翻译 程序 的 构造 原理 是 相似 的 。 

对 于 各 种 语法 结构 的 语法 制导 翻译 ， 一 般 是 在 相应 的 语法 规则 中 加 入 适当 的 语义 处 理 ， 下 
面 先 说 明 一 些 翻译 过 程 中 要 使 用 的 语义 变量 和 语义 过 程 。 
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e。 ”Entry(id): 在 符号 表 中 查找 标识 符 id 以 获取 它 在 表 中 的 位 置 (入口)。 
e。 ”S.code: 语句 S 被 翻译 后 形成 的 代码 序列 。 
。 ”Eplace: 与 非 终 结 符 E 相 联 系 的 语义 变量 ,表示 存放 值 的 变量 名 在 符号 表 的 入 口 或 
整数 码 〈 若 此 变量 是 临时 变量 )。 
。 Etc: 当 表 达 式 E 的 值 为 真 时 控制 流转 向 的 语句 标号 (四 元 式 的 地 址 编号 )。 
。 Efc: 当 表 达 式 EE 的 值 为 假 时 控制 流转 向 的 语句 标号 (四 元 式 的 地 址 编号 )。 
。 ”GEN(OP.ARG1,ARG2,RESULT): 产生 一 个 四 元 式 (OPARG1.ARG2.RESULT) 并 填 进 
四 元 式 表 中 。 
。 NXQ: 表示 下 一 个 将 要 形成 但 尚未 形成 的 四 元 式 地 址 〈 编 号 )。NXQ 的 初 值 为 1， 每 
执行 一 次 GENO，NXQ 就 自动 增加 1。 
e。 Merg(P1.P2): 把 以 Pl 和 了 2 为 链 首 的 两 条 链 合并 为 一 条 链 , 并 返回 合并 后 的 链 首 指针 。 
。 ”Backpatch(p,t): 把 p 所 链接 的 每 条 四 元 式 的 第 4 项 都 以 t 作为 值 进行 填充 。 
。 Newtemp: 生成 一 个 新 的 临时 存储 单元 。 
拉链 与 回填 的 基本 思想 是 当 某 些 四 元 式 中 存在 尚 不 确定 的 转向 地 址 时 , 将 所 有 转向 同一 地 
址 的 四 元 式 链接 成 一 个 链表 ， 一 旦 转向 地 址 被 确定 ， 则 沿 此 链 向 所 有 的 四 元 式 回填 该 地 址 。 
下 面 简单 说 明 程 序 设计 语言 中 常见 语言 结构 的 语法 制导 翻译 方法 。 
(1) 赋值 语句 及 简单 算术 表达 式 的 翻译 。 下 面 的 产生 式 描述 了 由 简单 变量 ， 算 术 加 、 乘 、 
取 负 运算 和 圆 括号 构成 的 简单 算术 表达 式 ， 以 及 将 一 个 算术 表达 式 赋值 给 一 个 简单 变量 的 赋值 
语句 的 语法 规则 。 
A 一 id:=E 
E-*E+EIE*E|-E|G)|id 


为 该 文法 编写 的 语义 规则 如 下 : 


Asid:=E {GEN(:=, E.place, _, Entry(id))} 
ESEV+E®Y {Eplace:=Newtemp: GEN(+,E .place,E® .place, E.place)} 
E 一 EDO* EC {Eplace:=Newtemp; GEN(*, EW .place, E® .place, E place)} 


E 一 -EO {E.place:=Newtemp: GEN(@, EV .place，, E.place)} 
E—(EW) {E.place:= EW place} 
E—id {E.place:=Entry(i1d)} 


(2) 布尔 表达 式 的 翻译 。 布 尔 表 达 式 常用 于 表示 选择 和 循环 控制 结构 中 的 条 件 ， 其 计算 过 
程 可 采用 直接 计算 和 短路 计算 两 种 形式 。 直 接 计 算是 指 布尔 表达 式 中 的 每 个 因子 都 进行 运算 ， 
而 短路 计算 是 指 只 要 表达 式 的 值 能 够 确定 下 来 ， 就 停止 计算 。 下 面 介绍 布尔 表达 式 作 为 控制 条 
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件 时 的 翻译 方法 〈 采 用 短路 计算 方式 )。 
布尔 表达 式 的 形式 定义 〈 文 法 ) 为 : 
E—E and EIE or Elnot E | (E) |id |id relop id 


其 中 ，relop 代表 关系 运算 符 (<、>、 三 、 宇 、 二 、)， 运 算 符 的 优先 级 和 结合 律 遵照 通常 的 
习惯 。E 一 EO and ES，E 一 EWor E® 的 代码 结构 如 图 2-19 (a) 和 图 2-19 (b) 所 示 。 


EVte E'.code EVfe EVfe Ete 
一 EP)code ED 人 EC)tc 
Ete Efe 
1 
Etc = EP)tc Efc=E fect+ EC 人 E.fe = ED2).fe E.tc= Etc+ ED)tc 
(拉链 ) (拉链 ) 
(a) E 一 Eand E® 的 代码 结构 (b) E 一 Eor E® 的 代码 结构 
图 2-19 and 与 or 的 代码 结构 示意 图 
改写 文法 并 编写 语义 子 程序 如 下 。 
对 于 E 一 EMand EH， 为 记 住 E® 的 第 一 条 四 元 式 的 地 址 ， 需 改写 为 : 
E^ 一 EQand { Backpatch(EV te, NXQ): E^fe := EOfe} /回填 真 出 口 ， 传 假 出 口 
E 一 E^EC {Etc :=EOtc，E.fe := Merg(E^fr， EC fc) } /传真 出 口 ， 合 并 假 出 口 
对 于 E 一 EOor E2， 为 记 住 E@ 的 第 一 条 四 元 式 的 地 址 ， 需 改写 为 ; 
E* 一 EQor {Backpatch(E® fe, NXQ); Evtc:= Etc} /回填 假 出 口 ， 传 真 出 口 
EDEE® {Etc:=Merg(Evtc， EQ®.tc); Efc :=E® fc} // 合 并 真 出 口 ， 传 假 出 口 
EnotEV {Etc:=EVfe; Efc:=EW.tc} 1/ 交换 真 、 假 出 口 
EEV) {Etc:=EVte; Efc=EV.fc} /1/ 传 真 、 假 出 口 


上 一 id {Etc :=NXQ:，Efe :=NXQ+1; GENGnz, Entry(id), -,0); GENG, -, -, 0);} 
EsidV relopid® {Etc:=NXQ:，Efe :=NXQ+1; 
GEN(irelop. Entry(id™), Entry(id®). 0); GENG, -, -, 0) 


(3) 常见 语句 的 翻译 。 下 面 简单 说 明 站 语句 和 while 语句 的 翻译 方法 ， 其 形式 定义 为 : 
S—AlifEthen SO | ifEthen SO else SO | while E do SO 


用 语义 变量 S.chain 记录 语句 结束 后 的 转向 地 址 。 回 填 工 作 将 在 处 理 S 的 外 层 环境 的 某 个 
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时 刻 完成 。 站 语句 的 代码 结构 如 图 2-20 所 示 ，while 循环 语句 的 代码 结构 如 图 2-21 所 示 。 


S.chain = E.fe+SO.chain( 拉 链 ) 


S.chain = SO.chain+q+S@).chain( 拉 链 ) 
(a) ifE then S@ 的 代码 结构 (b) ifE then SW else Se 的 代码 结构 
图 2-20 让 语句 的 代码 结构 


Efc 
E.code Etc 
SVcode S'"".chain 
q:G,_,_,0) 
S.chain 


图 2-21 while E do SO 的 代码 结构 


C 一 让 E then {Backpatch(E.tc, NXQ); C.chain :=E.fc} // 填 真 出 口 ， 传 假 出 口 
S 一 CSO) {S.chain := Merg(C.chain, SO.chain)} /拉链 
Te 一 CSO else {q:= NXQ; GENG, -,-, 0); T?.chain:=Merg(S®.chain,q); // 拉 链 
Backpatch(C.chain, NXQ); // 填 假 出 口 
} 
S 一 TeSO { S.chain:= Merg(T?.chain, SW .chain); } // 拉 链 
W—while {W.quad:=NXQ:;: } /记录 while 语句 的 首 地 址 
Wi WEdo {Backpatch(E.tc, NXQ); W!.chain := E.fe; // 填 真 出 口 ， 传 假 出 口 
Waquad:= W.quad // 传 首 地 址 
} 
S 一 WasO {Backpatch(SO.chain, W4quad); /Se 执行 完 后 转向 卫 
GEN(, -, -, Wi.quad); S.chain:= Weachain 1S 的 出 口 
S 一 A {S.chain:=0 } /赋值 语句 不 含 其 他 非常 规 出 口 〈 无 出 口 链 ) 


【 例 2.8】 设 NXQ 的 初 值 为 1， 每 产生 一 条 四 元 式 ，NXQ 的 值 就 增 1， 将 语句 if a<b then 
while a<b do a:=atb 翻译 成 四 元 式 的 主要 步骤 如 下 。 
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步 又 产 年: 式 语义 处 理 及 结果 有 
Etc:=(1) E.fc=(2) : (<,a,b,0) 
ls 产生 两 条 四 元 式 :G20) 
(2) i 用 NR 值 (=3) 回 填 E.te 所 记录 的 四 元 式 (1)， :aay 
C.chain:=(2) 
(3) W—while W.quad:=3 
(4) a E.tc:=(3) Sip) : (J<,a,b,0) 
产生 两 条 四 元 式 : (j,-,-,0) 
用 NXQ 值 5) 回 填 E.te 所 记录 的 四 元 式 (3)， 
(5) WW Edo | Wi.chain:=(4) : (j<a,b,5) 
Wdquad:=3 
(6) Eatb 生成 临时 存储 单元 贡 1， 产 生 一 条 四 元 式 : (+,a,b,tl) 
(7) A 一 id:=E 产生 一 条 四 元 式 : 〈:=,tl-,a) 
(8) S 一 人 S.chain:=(0) 
用 Wequad 值 (=3) 回 填 SW. chain 所 记录 的 四 ,G3) 
(9) S 一 WasO 元 式 (0)， 产 生 一 条 四 元 式 I 
S.chain:=(4) 
CIO SG 合并 Cn 和 SO.chain 两 条 链 , 并 将 合并 后 
的 链 赋值 给 S.chain:=(4,2) 


加 和 和 


(<,a,b,3) 
0,-,-,0) 
(J<,a,b,5) 
0,-,-,0) 
(+,a,b,tl) 
(:=,t],-,a) 
G3) 


最 后 产生 的 四 元 式 序列 如 下 所 示 ， 其 中 2、4 两 条 四 元 式 有 待 于 回填 。 


3) 动态 存储 分 配 和 过 程 调用 的 翻译 
过 程 (函数 ) 说 明和 过 程 ( 函 数 ) 调用 是 程序 中 一 种 常见 的 语言 结构 ， 绝 大 多 数 语言 都 含 
有 这 方面 的 内 容 。 过 程 说 明和 调用 语句 的 翻译 有 赖 于 形 参与 实 参 的 结合 方式 以 及 数据 空间 的 分 


配方 式 。 


由 于 各 种 语言 的 不 同 特点 ， 在 目标 程序 运行 时 ， 对 存储 空间 的 分 配 和 组 织 有 不 同 的 要 求 ， 


EE 
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在 编译 阶段 应 产生 相应 的 目标 来 满足 不 同 的 要 求 。 需 要 分 配 存储 空间 的 对 象 有 基本 数据 类 型 
〈 如 整 型 、 实 型 和 布尔 型 等 )、 结 构 化 数据 类 型 〈 如 数组 和 记录 等 ) 和 连接 数据 〈 如 返回 地 址 、 
参数 等 )。 分 配 的 依据 是 名 字 的 作用 域 和 生存 期 的 定义 规则 。 分 配 的 策略 有 静态 存储 分 配 和 动 
态 存储 分 配 两 大 类 。 

如 果 在 编译 时 就 能 确定 目标 程序 运行 时 所 需 的 全 部 数据 空间 的 大 小 , 则 在 编译 时 就 安排 好 
目标 程序 运行 时 的 全 部 数据 空间 ， 并 确定 每 个 数据 对 象 的 存储 位 置 ( 迪 辑 地 址 )， 这 种 分 配 策 
略称 为 静态 存储 分 配 。FORTRAN 语言 的 早期 版 本 可 以 完全 采用 静态 存储 分 配 策 略 。 

如 果 一 个 程序 设计 语言 允许 递归 过 程 和 可 变数 据 结构 ， 那 么 就 需 采 用 动态 存储 分 配 技 术 。 
动态 存储 分 配 策略 的 实现 有 栈 分 配方 式 和 堆 分 配方 式 两 种 。 在 栈 式 动态 存储 分 配 中 ， 将 程序 的 
数据 空间 设计 为 一 个 栈 ， 每 当 调用 一 个 过 程 时 ， 它 所 需 的 数据 空间 就 分 配 在 栈 项 ， 每 当 过 程 执 
行 结 束 时 ， 就 释放 这 部 分 空间 。 若 空间 的 使 用 未 必 服从 “ 先 申 请 后 释放 ”的 原则 ， 那 么 栈 式 的 
动态 存储 分 配方 式 就 不 适用 了 ， 这 种 情况 下 通常 使 用 堆 分 配 技术 。 下 面 仅 就 一 个 简单 的 栈 式 分 
配 为 例 ， 说 明 过 程 调用 和 过 程 说 明 的 翻译 。 

考虑 一 种 简单 的 程序 设计 语言 结构 : 没有 分 程序 结构 ， 过 程 定义 不 嵌 套 ， 但 允许 过 程 递归 调用 。 

称 过 程 〈 函 数 ) 的 一 次 运行 为 一 个 活动 。 活 动 是 一 个 动态 的 概念 ， 除 了 设计 为 永 不 停机 的 
过 程 ( 如 操作 系统 等 )， 或 者 是 因为 设计 错误 而 出 现 死 循环 的 情况 外 ， 任 何 过 程 的 活动 均 有 有 
限 的 生存 期 。 每 个 活动 在 运行 时 的 环境 称 为 它 的 活动 记录 。 一 般 情况 下 ， 一 个 活动 记录 的 内 容 
如 图 2-22 〈a) 所 示 ， 活 动 记录 内 容 的 一 种 安排 方式 如 图 2-22 (b) 所 示 。 其 中 ，SP 指向 当前 
活动 记录 在 控制 栈 中 的 起 始 位 置 ，TOP 指向 栈 项 位 置 。 


TOP 
1 参数 与 返回 地 址 临时 工作 单元 
一 局 部 数据 的 内 情 向 量 
2; 中 链 ( ) 
a 局 部 变量 
3 访问 链 【可 过) 
4 保存 的 机 器 状态 人 
参数 个 数 
5 林地 (局 部 ) 数据 
临时 变量 
控制 链 ( 原 SP) 
SP 
(a) 活动 记录 的 内 容 (b) 活动 记录 的 一 种 安排 方式 


图 2-22 ”过程 的 活动 记录 


设 SP 总 是 指向 现行 过 程 活动 记录 的 起 点 , TOP 始终 指向 栈 顶 单元 , 则 过 程 调 用 语句 call P 
(T1,T2,…,Tn》〉 的 四 元 式 序列 是 : 
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para Tl 
para TT2 


para Tn 
call Pn 


(1) 在 运行 时 ，para 和 call 应 产生 传递 参数 和 进行 调用 的 代码 。 


(it3)[TOP]:=Ti (传递 参数 值 ) ”或 (i+3)[ TOP]:=addr(Ti) (传递 参 数 地 址 ) 
1[TOP]:=SP〈 保 护 现 行 SP) 

3[TOP]:=n 传递 参数 个 数 ) 

JSR P (转子 程序 指令 ， 即 控制 转向 过 程 P 的 第 一 条 指令 ) 


(2) 转 入 过 程 P 后 ， 就 进入 过 程 说 明 的 代码 。 

SP:=TOP+1 (定义 新 的 SP) 

1[SP]:= 返 回 地址 (保留 返回 地 址 ) 

TOP:=TOP+L (定义 新 的 TOP，L 是 过 程 P 的 活动 记录 所 需要 的 单元 数 ， 编 译 时 可 确定 ) 
(3) 产生 过 程 说 明 中 数组 说 明 的 代码 ， 调 整 TOP 的 代码 。 

(4) 产生 过 程 体内 执行 语句 的 代码 〈 用 SP 变 址 方式 访问 数据 对 象 )。 

(5) 退出 过 程 语句 时 ，return(E) 的 代码 序列 如 下 。 


R:=E.place (把 EE 的 值 放 到 特定 的 寄存 器 RR 中 ， 调 用 段 将 从 中 获得 被 调用 过 程 的 结果 值 ) 


TOP:=SP-1 (恢复 TOP) 
SP:=[SP] (恢复 SP) 
PC:=2[TOP] ( 取 返 回 地 址 ) 
JMP PC 


8.， 中间 代码 优化 和 目标 代码 生成 


优化 就 是 对 程序 进行 等 价 变换 , 使 得 从 变换 后 的 程序 能 生成 更 有 效 的 目标 代码 。 所 谓 等 价 ， 
是 指 不 改变 程序 的 运行 结果 ; 所 谓 有 效 , 是 指 目标 代码 的 运行 时 间 较 短 ， 占 用 的 存储 空间 较 少 。 
优化 可 在 编译 的 各 个 阶段 进行 。 最 主要 的 优化 是 在 目标 代码 生成 以 前 对 中 间 代码 进行 的 ， 这 类 
优化 不 依赖 于 具体 的 计算 机 。 

目标 代码 的 生成 由 代码 生成 器 实现 。 代 码 生 成 器 以 经 过 语义 分 析 或 优化 后 的 中 间 代 码 为 输 
入 ， 以 特定 的 机 器 语言 或 汇编 代码 为 输出 。 代 码 生成 所 需 考虑 的 主要 问题 如 下 所 述 。 

(1) 中 间 代码 形式 。 中 间 代 码 有 多 种 形式 ， 其 中 树 与 后 绥 表 示 形 式 适 用 于 解释 器 ， 而 编译 
器 多 采用 与 机 器 指令 格式 较 接近 的 四 元 式 形式 。 
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(2) 目标 代码 形式 。 目 标 代码 可 以 分 为 两 大 类 : 汇编 语言 形式 和 机 器 指令 形式 。 机 器 指令 
形式 的 目标 代码 又 可 以 根据 需求 的 不 同 分 为 绝对 机 器 指令 代码 和 可 再 定位 机 器 代码 。 绝 对 机 器 
代码 的 优点 是 可 以 立即 执行 , 一般 应 用 于 一 类 称 为 load-and-go 形式 的 编译 模式 ， 即 编译 后 立即 
执行 ， 不 形成 保存 在 外 存 上 的 目标 代码 文件 。 可 再 定位 机 器 代码 的 优点 是 目标 代码 可 以 被 任意 
链接 并 装 入 内 存 的 任意 位 置 ， 它 是 编译 器 采用 较 多 的 代码 形式 。 汇 编 语言 作为 一 种 中 间 输 出 形 
式 ， 便 于 进行 分 析 和 测试 。 

(3) 寄存 器 的 分 配 。 由 于 访问 寄存 器 的 速度 远 远 快 于 访问 内 存单 元 的 速度 ， 所 以 人 们 总 是 
希望 尽 可 能 多 地 使 用 寄存 器 存储 数据 ， 而 寄存 器 的 个 数 是 有 限 的 ， 因 此 ， 如 何 分 配 及 使 用 寄存 
器 是 目标 代码 生成 时 需要 着 重 考虑 的 。 

(4) 计算 次 序 的 选择 。 代 码 执行 的 效率 会 随 计算 次 序 的 不 同 有 较 大 的 差别 。 在 生成 正确 目 
标 代码 的 前 提 下 适当 地 安排 计算 次 序 并 优化 代码 序列 ， 也 是 生成 目标 代码 时 要 考虑 的 重要 因素 
Ed 


2.2.3 ”解释 程序 基本 原理 


解释 程序 是 另 一 种 语言 处 理 程序 ， 在 词法 、 语 法 和 语义 分 析 方 面 与 编译 程序 的 工作 原理 基 
本 相同 ， 但 是 在 运行 用 户 程序 时 ， 它 直接 执行 源 程序 或 源 程序 的 中 间 表 示 形 式 。 因 此 ， 解 释 程 
序 不 产生 源 程序 的 目标 程序 , 这 是 它 和 编译 程序 的 主要 区 别 。 图 2-23 显示 了 解释 程序 实现 高 级 
Be Te 

源 程序 被 直接 解释 执行 的 处 理 方式 如 图 2-23 中 的 标记 
A 所 示 。 这 种 解释 程序 对 源 程序 进行 逐个 字符 的 检查 ,然后 
执行 程序 语句 规定 的 动作 。 例 如 ， 如 果 扫 描 到 符号 序列 : 


中 间 代 码 


B 


中 间 代 码 


GOTO 工 
解释 程序 就 开始 搜索 源 程序 中 标号 工 的 定义 位 置 即 工 后 机 本 语言 ! 
面 紧 跟 冒 号 “:” 的 语句 位 置 )。 这 类 解释 程序 通过 反复 扫描 - 
源 程序 来 实现 程序 的 运行 ， 运 行 效率 很 低 。 图 2-23 解释 器 类 型 示意 图 


解释 程序 也 可 以 先 将 源 程序 翻译 成 某 种 中 间 代码 形式 ， 然 后 对 中 间 代 码 进行 解释 来 实现 用 
户 程序 的 运行 ， 这 种 翻译 方式 如 图 2-23 中 的 标记 B 和 C 所 示 。 通 常 ， 在 中 间 代 码 和 高 级 语言 
的 语句 间 存 在 一 一 对 应 的 关系 。APL 和 SNOBOL4 的 很 多 实现 就 采用 这 种 方法 。 解释 方式 B 和 
C 的 不 同 之 处 在 于 中 间 代 码 的 级 别 , 在 方式 C 下 , 解释 程序 采用 的 中 间 代 码 更 接近 于 机 器 语言 。 
在 这 种 实现 方案 中 ， 高 级 语言 和 低级 中 间 代码 间 存 在 着 1-n 的 对 应 关系 。PASCAL-P 解释 系统 
是 这 类 解释 程序 的 一 个 实例 ， 它 在 词法 分 析 、 语 法 分 析 和 语义 基础 上 ， 先 将 源 程序 翻译 成 P- 
代码 , 再 由 一 个 非常 简单 的 解释 程序 来 解释 执行 这 种 P- 代 码 。 这 类 系统 具有 比较 好 的 可 移植 性 。 
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1. 解释 程序 的 基本 结构 


解释 程序 通常 可 以 分 成 两 部 分 : 第 一 部 分 是 分 析 部 分 ， 包 括 通常 的 词法 分 析 、 语 法 分 析 和 
语义 分 析 程序 ， 经 语义 分 析 后 把 源 程序 翻译 成 中 间 代码 ， 中 间 代 码 常 采用 道 波兰 表示 形式 。 第 
二 部 分 是 解释 部 分 ， 用 来 对 第 一 部 分 产生 的 中 间 代 码 进行 解释 执行 。 下 面 简要 介绍 第 二 部 分 的 
工作 原理 。 

设 用 数组 MEM 模拟 计算 机 的 内 存 ， 源 程序 的 中 间 代码 和 解释 部 分 的 各 个 子 程序 都 存放 在 
数组 MEM 中 。 全 局 变量 PC 是 一 个 程序 计数 器 ， 它 记录 了 当前 正在 执行 的 中 间 代码 的 位 置 。 
这 种 解释 部 分 的 常见 结构 可 以 由 下 面 两 部 分 组 成 。 

(LY PC=PCPl。 

(2) 执行 位 于 opcode-table[MEM[PC]] 的 子 程序 (解释 子 程序 执行 后 返回 到 前 面 )。 

下 面 用 一 个 简单 的 例子 来 说 明 其 工作 原理 。 设 两 个 实 型 变量 4 和 B 进 行 相 加 的 中 间 代 码 是 : 


start: Ipush 
A 
Ipush 
B 
Iaddreal 


其 中 ， 中 间 代 码 Ipush 和 Iaddreal 实际 上 都 是 opcode-table 表 的 索引 值 〈 即 位 移 )， 而 该 表 的 单 
元 中 存放 的 值 就 是 对 应 的 解释 子 程序 的 起 始 地 址 ，4 和 B 都 是 MEM 中 的 索引 值 。 解 释 部 分 开 
始 执行 时 ，PC 的 值 为 start-1。 


opcode-table [Ipush]=push 
opcode-table[Iaddreal]=addreal 
解释 部 分 可 表示 如 下 : 
interpreter-loop: “PC:=PC+1; 
goto opcode-table[MEMI[PC]]:; 
push: PC:=PC+]1; 
stackreal(MEM[MEMI[PC])): 
goto interpreter-loop; 
addreal: stackreal(poprealO+popreal()); 
goto interpreter-loop; 
… (其余 各 解释 子 程序 ， 此 处 省 略 )? 


其 中 ，stackreal0 表 示 把 相应 值 压 入 栈 中 ， 而 popreal0 表 示 取 得 栈 项 元 素 值 并 弹出 栈 顶 元 素 。 上 
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面 的 代码 基于 栈 实现 了 将 两 个 数值 相 加 并 将 结果 存 入 栈 中 的 处 理 。 
2. 高 级 语言 编译 与 解释 方式 的 比较 


对 于 高 级 语言 的 编译 和 解释 工作 方式 ， 可 以 从 以 下 几 个 方面 进行 比较 。 

(1) 效率 。 编 译 比 解释 方式 可 能 取得 更 高 的 效率 。 

一 般 情 况 下 ， 在 解释 方式 下 运行 程序 时 ， 解 释 程序 可 能 需要 反复 扫描 源 程序 。 例 如 ， 每 一 
次 引用 变量 都 要 进行 类 型 检查 ， 甚 至 需要 重新 进行 存储 分 配 ， 从 而 降低 了 程序 的 运行 速度 。 在 
空间 上 ， 以 解释 方式 运行 程序 需要 更 多 的 内 存 ， 因 为 系统 不 但 需要 为 用 户 程序 分 配 运行 空间 ， 
而 且 要 为 解释 程序 及 其 支撑 系统 分 配 空间 。 

在 编译 方式 下 ， 编 译 程序 除了 对 源 程序 进行 语法 和 语义 分 析 外 ， 还 要 生成 源 程序 的 目标 代 
码 并 进行 优化 ， 所 以 这 个 过 程 比 解释 方式 需要 更 多 的 时 间 。 虽 然 与 仔细 写 出 的 机 器 程序 相 比 ， 
由 编译 程序 创建 的 目标 程序 运行 的 时 间 一 般 更 长 ， 需 要 占用 的 存储 空间 更 多 ， 但 源 程 序 只 需要 
被 编译 程序 翻译 一 次 就 可 以 多 次 运行 。 因 此 ， 总 体 来 讲 ， 编 译 方式 比 解释 方式 可 能 取得 更 高 的 
效率 。 

(2) 灵活 性 。 由 于 解释 程序 需要 反复 检查 源 程序 ， 这 也 使 得 解释 方式 能 够 比 编译 方式 更 灵 
活 。 当 解释 器 直接 运行 源 程序 时 ,“ 在 运行 中 ”修改 程序 就 成 为 可 能 ， 例 如 增加 语句 或 者 修改 
错误 等 。 另 外 ， 当 解释 器 直接 在 源 程序 上 工作 时 ， 它 可 以 对 错误 进行 更 精确 地 定位 。 

(3) 可 移植 性 。 解 释 器 一 般 也 是 用 某 种 程序 设计 语言 编写 的 ， 因 此 只 要 对 解释 器 进行 重新 
编译 ， 就 可 以 使 解释 器 运行 在 不 同 的 环境 中 。 

由 于 编译 和 解释 的 方法 各 有 特点 ， 因 此 现 有 的 一 些 编译 系统 既 提 供 编译 的 方式 ， 也 提供 解 
释 的 方式 , 甚至 将 两 种 方式 进行 结合 。 例如 , 在 Java 虚拟 机 上 发 展 的 一 种 compiling-just-in-time 
新 技术 ， 就 是 在 代码 第 一 次 运行 时 进行 编译 ， 其 后 运行 时 就 不 再 进行 编译 了 。 


国 国 汪 第 3 章 数据 结构 有 


数据 结构 是 程序 设计 的 重要 基础 , 它 所 讨论 的 内 容 和 技术 对 从 事 软件 项 目的 开发 有 重要 作 
用 。 学 习 数 据 结构 要 达到 的 目标 是 学 会 从 问题 出 发 ， 分 析 和 研究 计算 机 加 工 的 数据 的 特性 ， 以 
便 为 应 用 所 涉及 的 数据 选择 适当 的 逻辑 结构 、 存 储 结构 及 其 相应 的 操作 方法 ， 为 提高 利用 计算 
机 解决 问题 的 效率 服务 。 

数据 结构 是 指数 据 元 素 的 集合 及 元 素 间 的 相互 关系 和 构造 方法 。 元 素 之 间 的 相互 关系 是 数 
据 的 逻辑 结构 ， 数 据 元 素 及 元 素 之 间 关 系 的 存储 称 为 存储 结构 (或 物理 结构 )。 数 据 结构 按照 
逻辑 关系 的 不 同 分 为 线性 结构 和 非 线 性 结构 两 大 类 ， 其 中 ， 非 线性 结构 又 可 分 为 树 结构 和 图 
结构 。 

算法 与 数据 结构 密切 相关 ， 数 据 结 构 是 算法 设计 的 基础 ， 设 计 合理 的 数据 结构 可 使 算法 简 
单 而 高 效 。 


3.1 ”线性 结构 

线性 结构 是 一 种 基本 的 数据 结构 ， 主 要 用 于 对 客观 世界 中 具有 单一 前 驱 和 后 继 的 数据 关系 
进行 描述 。 线 性 结构 的 特点 是 数据 元 素 之 间 呈 现 一 种 线性 关系 ， 即 元 素 “一 个 接 一 个 排列 ”。 
3.1.1 线性 表 


线性 表 是 最 简单 、 最 基本 也 是 最 常用 的 一 种 线性 结构 。 常 采用 顺序 存储 和 链 式 存储 ， 主 要 
的 基本 操作 是 插入 、 删 除 和 查找 等 。 


1. 线性 表 的 定义 
一 个 线性 表 是 xz > 0) 个 元 素 的 有 限 序列 ， 通 常 表示 为 《al ax, …, an)。 非 空 线性 表 的 特点 


如 下 。 
(1) 存在 唯一 的 一 个 称 作 “ 第 一 个 ”的 元 素 。 

(2) 存在 唯一 的 一 个 称 作 “ 最 后 一 个 ”的 元 素 。 

(3) 除 第 一 个 元 素 外 ， 序 列 中 的 每 个 元 素 均 只 有 一 个 直接 前 驱 。 
(4) 除 最 后 一 个 元 素 外 ， 序 列 中 的 每 个 元 素 均 只 有 一 个 直接 后 继 。 
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2. 线性 表 的 存储 结构 a 


线性 表 的 存储 结构 分 为 顺序 存储 和 链 式 存储 。 
1) 线性 表 的 顺序 存储 
线性 表 的 顺序 存储 是 指 用 一 组 地 址 连续 的 存储 单元 依次 存储 线性 表 


中 的 数据 元 素 ， 从 而 使 得 逻辑 上 相 邻 的 两 个 元 素 在 物理 位 置 上 也 相 邻 ， 如 六 
图 3-1 所 示 。 在 这 种 存储 方式 下 ， 元 素 间 的 逻辑 关系 无 须 占 用 额外 的 空间 an 
来 存储 。 


一 般 地 ， 以 LOC(ey) 表 示 线 性 表 中 第 一 个 元 素 的 存储 位 置 ， 在 顺序 在。 和 站 生生 和 的 


储 结构 中 ， 第 i 个 元 素 a; 的 存储 位 置 为 

LOC(ai)=LOC(ai)+(i-1) XL 
其 中 , 工 是 表 中 每 个 数据 元 素 所 占 空间 的 字 节 数 。 根 据 该 计算 关系 ， 可 随机 存 取 表 中 的 任 一 个 
元 素 。 

线性 表 采 用 顺序 存储 结构 的 优点 是 可 以 随机 存 取 表 中 的 元 素 ， 缺 点 是 插入 和 删除 操作 需要 
移动 元 素 。 在 插入 前 要 移动 元 素 以 挪 出 空 的 存储 单元 ， 然 后 再 插入 元 素 ， 删除 时 同样 需要 移动 
元 素 ， 以 填充 被 删除 的 元 素 空 出 来 的 存储 单元 。 

在 表 长 为 ”的 线性 表 中 插入 新 元 素 时 ,共有 ntl 个 插入 位 置 , 在 位 置 1 (元 素 wa 所 在 位 置 ) 
插入 新 元 素 ， 表 中 原 有 的 n 个 元 素 都 需要 移动 ， 在 位 置 nt1 (元 素 wm 记 在 位 置 之 后 ) 插入 新 元 
素 时 不 需要 移动 任何 元 素 ， 因 此 ， 等 概率 下 《〈 即 新 元 素 在 x+1 个 位 置 插入 的 概率 相同 时 ) 插入 
一 个 新 元 素 需要 移动 的 元 素 个 数 期 望 值 Esen 为 


Ean -$7 XitD = 二 i 
其 中 ，Pi 表 示 在 表 中 的 位 置 i 插入 新 元 素 的 概率 。 

在 表 长 为 n 的 线性 表 中 删除 元 素 时 ， 共 及 个 可 删除 的 元 素 ， 删 除 元 素 a 时 需要 移动 n-1 
个 元 素 ， 删 除 元 素 a 时 不 需要 移动 元 素 ， 因 此 ， 在 等 概率 下 删除 元 素 时 需要 移动 的 元 素 个 数 期 
望 值 Faueee 为 


n 


Pa = Dg Xm-)= LY) = 


其 中 ，g; 表 示 删 除 第 i 个 元 素 ( 即 a;) 的 概率 。 

2) 线性 表 的 链 式 存储 

线性 表 的 链 式 存储 是 用 通过 指针 链接 起 来 的 结 点 来 存储 数据 元 素 ， 基 本 的 结 点 结构 如 下 
所 示 : 


= 
2 
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指针 域 
其 中 ， 数 据 域 用 于 存储 数据 元 素 的 值 ， 指 针 域 则 存储 当前 元 素 的 直接 前 驱 或 直接 后 继 的 位 置信 
息 ， 指 针 域 中 的 信息 称 为 指针 或 链 )。 
存储 各 数据 元 素 的 结 点 的 地 址 并 不 要 求 是 连续 的 ， 因 此 存储 数据 元 素 的 同时 必须 存储 元 素 
之 间 的 逻辑 关系 。 另 外 ， 结 点 空间 只 有 在 需要 的 时 候 才 申请 ， 无 须 事先 分 配 。 
结 点 之 间 通 过 指针 域 构成 一 个 链表 ， 若 结 点 中 只 有 一 个 指针 域 ， 则 称 为 线性 链表 (或 单 链 
表 )， 如 图 3-2 所 示 。 


Head 四 局 四 医 可 入 四 网 
图 3-2 线性 表 的 单 链表 存储 
设 线 性 表 中 的 元 素 是 整 型 ， 则 单 链 表 结 点 类 型 的 定义 为 : 


typedef struct node{ 
int data; 目 结 点 的 数据 域 ， 此 处 假设 为 整 型 */ 
struct node *next; 人 # 结 点 的 指针 域 #/ 
}NODE,*LinkList; 


在 链 式 存储 结构 中 ， 只 需要 一 个 指针 ( 称 为 头 指针 ， 如 图 3-2 中 的 head) 指向 第 一 个 结 点 ， 
at de ed -个 元 素 。 

在 链 式 存储 结构 下 进行 插入 和 删除 ， 其 实质 都 是 对 相关 指针 的 修改 。 在 单 链 表 中 ， 若 在 p 
所 指 结 点 后 插入 新 元 素 结 点 〈s 所 指 结 点 ， 已 经 生成 )， 如 图 3-3 Ca) 所 示 ， 其 基本 步骤 如 下 。 

(1) s->next = p->next:; 

(2) p->next= s; 

即 先 将 p 所 指 结 点 的 后 继 结 点 指针 赋 给 s 所 指 结 点 的 指针 域 ,然后 将 p 所 指 结 点 的 指针 域 
修改 为 指向 s 所 指 结 点 。 


Sa p 、 
.fd [~ 
了 Dp | eal -| b ”| 7 | Wr 
3 ee 
(a) 在 单 链表 中 插入 结 点 (b) 在 单 链表 中 删除 结 点 


图 3-3 在 单 链 表 中 插入 、 删 除 结 点 时 的 指针 变化 示意 图 
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同 理 ， 在 单 链表 中 删除 p 所 指 结 点 的 后 继 结 点 时 〈 如 图 3-3 (b) 所 示 )， 步 骤 如 下 。 

(1) q= p->next; 

(2) p->next = p->next->next; 

(3) free(q); 

即 先 令 临时 指针 q 指向 待 删除 的 结 点 , 然后 修改 p 所 指 结 点 的 指针 域 为 指向 p 所 指 结 点 的 
后 继 的 后 继 结 点 ， 从 而 将 元 素 b 所 在 的 结 点 从 链表 中 删除 ， 最 后 释放 q 所 指 结 点 的 空间 。 

在 实际 应 用 中 , 为 了 简化 对 链表 状态 的 判定 和 处 理 , 特别 引入 一 个 不 存储 数据 元 素 的 结 点 ， 
称 为 头 结 点 ， 将 其 作为 链表 的 第 一 个 结 点 并 令 头 指针 指向 该 结 点 。 

下 面 给 出 单 链表 上 查找 、 插 入 和 删除 运算 的 实现 过 程 。 

【函数 】 单 链表 的 查找 运算 。 


LinkList Find_List(LinkList L, int k) /并 为 带头 结 点 单 链表 的 头 指针 */ 
人 # 在 表 中 查找 第 k 个 元 素 ， 若 找到 ， 返 回 该 元 素 结 点 的 指针 ;， 否则， 返回 空 指针 NULL*/ 
{ LinkListp; inti; 


i=1;p=L->next; /# 初 始 时 ， 令 P 指向 第 一 个 元 素 结 点 ，i 为 计数 器 */ 

while (p &&i<k) { 刻 顺 指针 链 向 后 查找 ， 直 到 p 指向 第 k 个 元 素 结 点 或 p 为 空 指针 */ 
p=p->next; 计 +; 

} 

站 (p&&i 一 returmp;  /# 存 在 第 k 个 元 素 且 指针 p 指向 该 元 素 结 点 */ 

retum NULL:; 刻 第 kk 个 元 素 不 存在 ， 返 回 空 指针 */ 


} /*Find_List*/ 
【函数 】 单 链表 的 插入 运算 。 


int Insert_List (LinkList L, int k, int newElem) /*L 为 带头 结 点 单 链表 的 头 指针 */ 
人 # 将 元 素 newElem 插入 表 中 的 第 k 个 元 素 之 前 ， 车 成 功 则 返回 0， 否则 返回 -1*/ 
证 该 插入 操作 等 同 于 将 元 素 newElem 插入 在 第 k-1 个 元 素 之 后 */ 


{ LinkList p,s; /*p、s 为 临时 指针 */ 
f= Dp=L; /# 元 素 newElem 要 插入 到 第 1 个 元 素 之 前 */ 
else p=Find List(L.k-1); 旋 查 找 表 中 的 第 kl 个 元 素 并 令 p 指向 该 元 素 结 点 */ 
if(!p) retum —1; * 表 中 不 存在 第 -1 个 元 素 ， 不 满足 运算 要 求 */ 


s = (NODE *)malloc(sizeofNODE)):; /* 创 建新 元 素 的 结 点 空间 */ 


第 3 章 数据 结构 富 吕 BD 


1f(!s) retum —1; 
s->data = newElem:; 
s->next =p->next; p->next=s; /# 将 元 素 newElem 插入 第 -1 个 元 素 之 后 */ 
return 0; 
} /* Insert_List */ 


【函数 】 单 链表 的 删除 运算 。 


int Delete_List (LinkList L, int lo /并 为 带头 结 点 单 链表 的 头 指针 */ 
族 删 除 表 中 的 第 个 元 素 结 点 ， 若 成 功 则 返回 0， 否则 返回 -1*/ 
必 删 除 第 k 个 元 素 相当 于 令 第 k-1 个 元 素 结 点 的 指针 域 指向 第 k+l 个 元 素 所 在 结 点 */ 


{LinkList p,q; /*p、q 为 临时 指针 */ 
if(k=1)p=L; 证 删除 的 是 第 一 个 元 素 结 点 */ 
else p=Find List(L,k-1); 诈 查 找 表 中 的 第 kl 个 元 素 并 令 p 指向 该 元 素 结 点 */ 
if (Ipll!p->next) retum —1; * 表 中 不 存在 第 kk 个 元 素 */ 
qd = p->next; 人 # 令 q 指向 第 kk 个 元 素 结 点 */ 
p->next = q->next; free(q); 放 删 除 结 点 */ 
return 0; 


}/* Delete List */ 


当 线 性 表 采 用 链表 作为 存储 结构 时 ， 不 能 对 数据 元 素 进行 随机 访问 ， 但 是 具有 插入 和 删除 
操作 不 需要 移动 元 素 的 优点 。 
根据 结 点 中 指针 域 的 设置 方式 ， 还 有 其 他 几 种 链表 结构 。 
。 ”双向 链表 。 每 个 结 点 包含 两 个 指针 ， 分 别 指 出 当前 元 素 的 直接 前 驱 和 直接 后 继 。 其 特 
点 是 可 以 从 表 中 任意 的 结 点 出 发 ， 从 两 个 方向 上 遍历 链表 。 
。 ”循环 链表 。 在 单 向 链表 (或 双向 链表 〉 的 基础 上 令 表 尾 结 点 的 指针 指向 链表 的 第 一 个 
结 点 ， 构 成 循环 链表 。 其 特点 是 可 以 从 表 中 任意 结 点 开始 遍历 整个 链表 。 
。 ”静态 链表 。 借 助 数组 来 描述 线性 表 的 链 式 存储 结构 ， 用 数组 元 素 的 下 标 表 示 元 素 所 在 
结 点 的 指针 。 
若 双 向 链表 中 结 点 的 front 和 next 指针 域 分 别 指示 当前 结 点 的 直接 前 驱 和 直接 后 继 ， 则 在 
双向 链表 中 插入 结 点 *s 时 指针 的 变化 情况 如 图 3-4 (a) 所 示 ， 其 操作 过 程 可 表示 为 : 
(1) s > front=p -> front; 
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(2) p -> front -> next=s:; /或 者 表示 为 s -> front -> next = s; 
(3) s ->next=p; 
(4) p>front=s; 
在 双向 链表 中 删除 结 点 时 指针 的 变化 情况 如 图 3-4 (b) 所 示 ， 其 操作 过 程 可 表示 为 
(1) p -> front -> next=p -> next:; 
(2) p -> next -> front = p -> front; free(p): 
0 


; 了 
“Th 
OO i L 
(a) 在 双向 链表 中 插入 结 点 (b) 在 双向 链表 中 删除 结 点 
图 3-4 “在 双向 链表 插入 和 删除 结 点 时 的 指针 变化 示意 图 


3.1.2” 栈 和 队列 


栈 和 队列 是 程序 中 常用 的 两 种 数据 结构 ， 它 们 的 逻辑 结构 和 线性 表 相同 。 其 特点 在 于 运算 
有 所 限制 : 栈 按 “ 后 进 先 出 ”的 规则 进行 操作 ， 队 列 按 “ 先 进 先 出 ”的 规则 进行 操作 ， 故 称 为 
运算 受 限 的 线性 表 。 


1. 栈 


1) 栈 的 定义 及 基本 运算 
(1) 栈 的 定义 。 

是 只 能 通过 访问 它 的 一 端 来 实现 数据 存储 和 检索 的 一 种 线性 数据 结构 。 换 名 话说， 栈 的 
修改 是 按 先进 后 出 的 原则 进行 的 。 因 此 ， 栈 又 称 为 后 进 先 出 (Last In First Out，LIFO) 的 线性 
表 。 在 栈 中 进行 插入 和 删除 操作 的 一 端 称 为 栈 项 (Top)， 相 应 地 ， 另 一 端 称 为 栈 底 Bottom)。 
不 含 数据 元 素 的 栈 称 为 空 栈 。 

(2) 栈 的 基本 运算 。 

@ 初始 化 栈 InitStack(S): 创建 一 个 空 栈 S。 

@ 判 栈 空 isEmpty(S): 当 栈 $ 为 空 时 返回 “ 真 ”， 否 则 返回 “ 假 ”。 

@ 入 栈 Push(S,x): 将 元 素 x 加 入 栈 项 ， 并 更 新 栈 顶 指针 。 

@ 出 栈 Pop(S): 将 栈 项 元 素 从 栈 中 删除 ， 并 更 新 栈 顶 指针 。 若 需要 得 到 栈 项 元 素 的 值 ， 
可 将 Pop(S) 定 义 为 一 个 返回 栈 项 元 素 值 的 函数 。 
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@ 读 栈 项 元 素 Top(S): 返回 栈 项 元 素 的 值 ， 但 不 修改 栈 项 指针 。 

在 应 用 中 常 使 用 上 述 5 种 基本 运算 实现 基于 栈 结构 的 问题 求解 。 

2) 栈 的 存储 结构 

(1) 顺序 存储 。 栈 的 顺序 存储 是 指 用 一 组 地 址 连续 的 存储 单元 依次 存储 自 栈 项 到 栈 底 的 数 
据 元 素 ， 同 时 附设 指针 top 指示 栈 顶 元 素 的 位 置 。 采 用 顺序 存储 结构 的 栈 也 称 为 顺序 栈 。 在 这 
种 存储 方式 下 ， 需 要 预先 定义 〈 或 申请 ) 栈 的 存储 空间 ， 也 就 是 说 ， 栈 空间 的 容量 是 有 限 的 。 
因此 ， 在 顺序 栈 中 ， 当 一 个 元 素 入 栈 时 ， 需 要 判断 是 否 栈 满 〈 栈 空 


间 中 没有 空闲 单元 )， 若 栈 满 ， 则 元 素 不 能 入 栈 。 本 
(2) 栈 的 链 式 存储 。 用 链表 作为 存储 结构 的 栈 也 称 为 链 栈 。 和 由 
于 栈 中 元 素 的 插入 和 删除 仅 在 栈 项 一 端 进行 ， 因 此 不 必 另 外 设置 头 |) 
指针 ， 链 表 的 头 指针 就 是 栈 顶 指针 。 链 栈 的 表示 如 图 3-5 所 示 。 
(3) 栈 的 应 用 。 栈 的 由 型 应 用 包括 表达 式 求 值 、 括 号 匹配 等 ， 
在 计算 机 语言 的 实现 以 及 将 递归 过 程 转变 为 非 递归 过 程 的 处 理 中 ， 加 四 区 
以 生生 要 的 作用 。 图 3-5 链 柜 示意 图 
2， 队 列 


1) 队列 的 定义 及 基本 运算 

(1) 队列 的 定义 。 队 列 是 一 种 先进 先 出 (First In First Out，FIFO) 的 线性 表 ， 它 只 允许 在 
表 的 一 端 插入 元 素 , 而 在 表 的 另 一 端 删除 元 素 。 在 队列 中 , 允许 插入 元 素 的 一 端 称 为 队 尾 (Rear)， 
允许 删除 元 素 的 一 端 称 为 队 头 (Front)。 

(2) 队列 的 基本 运算 。 

@ 初始 化 队列 nitQueue(Q): 创建 一 个 空 的 队列 Q。 

加 判 队 空 isEmpty(Q): 当 队 列 为 空 时 返回 “ 真 ”， 否 则 返回 “ 假 ”。 

图 入 队 EnQueue(Q,x): 将 元 素 x 加 入 到 队列 Q 的 队 尾 ， 并 更 新 队 尾 指针 。 

@ 出 队 DelQueue(Q): 将 队 头 元 素 从 队列 Q 中 删除 ， 并 更 新 队 头 指针 。 

@@ 读 队 头 元 素 FrontQue(Q): 返回 队 头 元 素 的 值 ， 但 不 更 新 队 头 指针 。 

2) 队列 的 存储 结构 

(1) 队列 的 顺序 存储 。 队 列 的 顺序 存储 结构 又 称 为 顺序 队列 ， 它 也 是 利用 一 组 地 址 连续 的 
存储 单元 存放 队列 中 的 元 素 。 由 于 队列 中 元 素 的 插入 和 删除 限定 在 表 的 两 端 进行 ， 因 此 设置 队 
头 指 针 和 队 尾 指针 ， 分 别 指出 当前 的 队 头 和 队 尾 。 

下 面 设 顺序 队列 Q 的 容量 为 6， 其 队 头 指针 为 font， 队 尾 指针 为 rear， 头 、 尾 指针 和 队列 
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中 元 素 之 间 的 关系 如 图 3-6 所 示 。 


Q.rear 
5 5 5| es 
让 4 4 4| es 
Qrear | 
3 一 人 ea 3| 6 
2 ©3 Qfront > ey Qfront _ 2 es 
-2 一 一 一 ~ 
Qrear 1 1 ba 1 Y 
一 一 一 一 -一 一 | 
Qfront 0 Qfront 0 © 0 0 
i 
(a) 空 队 列 (b) @, @, @ (c) et、 所 相继 (d) es、e5、e6 
相继 入 队 之 后 出 队 之 后 相继 入 队 之 后 


图 3-6 队列 的 头 、 尾 指针 与 队列 中 元 素 之 间 的 关系 


在 顺序 队列 中 ， 为 了 降低 运算 的 复杂 度 ， 元 素 入 队 时 只 修改 队 尾 指针 ， 元 素 出 队 时 只 修改 
队 头 指针 。 由 于 顺序 队列 的 存储 空间 容量 是 提前 设 定 的 ， 所 以 队 尾 指针 会 有 一 个 上 限 值 ， 当 队 
尾 指针 达到 该 上 限时 ， 就 不 能 只 通过 修改 队 尾 指 针 来 实现 新 元 素 的 入 队 操 作 了 。 若 将 顺序 队列 
假想 成 一 个 环 状 结构 (通过 整除 取 余 运 算 实现 )， 则 可 维持 入 队 、 出 队 操 作 运算 的 简单 性 ， 如 
图 3-7 所 示 ， 称 之 为 循环 队列 。 


(a) 一 般 情况 (b) 空 队列 (c) 队列 满 


图 3-7 循环 队列 的 头 、 尾 指针 示意 图 


设 循环 队列 Q 的 容量 为 MAXSIZE， 初 始 时 队列 为 室 ， 且 Qzrear 和 Q .front 都 等 于 0， 如 图 
3-8 (a) 所 示 。 

元 素 入 队 时 ， 修 改 队 尾 指针 Q.rear = (Q.rear+1)% MAXSIZE， 如 图 3-8 (b) 所 示 。 

元 素 出 队 时 ， 修 改 队 头 指针 Q.front = (Q .fontt1)% MAXSIZE， 如 图 3-8 〈c) 所 示 。 

根据 队列 操作 的 定义 ， 当 出 队 操作 导致 队列 变 为 空 时 ， 则 有 Q.rear 一 Q.front， 如 图 3-8 (d) 
所 示 ; 若 入 队 操作 导致 队列 满 ， 则 Q.rear 一 Q.front， 如 图 3-8 (e) 所 示 。 

在 队列 宝 和 队列 满 的 情况 下 ， 循 环 队列 的 队 头 、 队 尾 指针 指向 的 位 置 是 相同 的 ， 此 时 仅仅 


根据 Qrear 
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和 Qfront 之 间 的 关系 无 法 断定 队列 的 状态 。 为 了 区 别 队 空 和 队 满 的 情况 ， 可 采用 以 


下 两 种 处 理 方式 : 其 一 是 设置 一 个 标志 ， 以 区 别 头 、 尾 指针 的 值 相 同时 队列 是 空 还 是 满 ， 其 二 
是 牺牲 一 个 存储 单元 ， 约 定 以 “队列 的 尾 指针 所 指 位 置 的 下 一 个 位 置 是 队 头 指 针 时 ”表示 队列 


满 ， 如 图 3- 


Q.front 


8 〈f) 所 示 ， 而 头 、 尾 指针 的 值 相 同时 表示 队列 为 空 。 


Qirear ey yo, Qfront zal 本 
-~ 三 


(b) 元 素 ee、er/、es 入 队列 后 (c) 元 素 ee 出 队列 后 


(d) 空 队列 (e) 队列 满 (f) 队列 满 
图 3-8 循环 队列 的 头 、 尾 指针 示意 图 


设 队列 中 的 元 素 类 型 为 整 型 ， 则 循环 队列 的 类 型 定义 如 下 。 


#define MAXQSIZE 100 

typedef struct { 
int *base; 人 # 循 环 队列 的 存储 空间 ， 假 设 队 列 中 存放 的 是 整 型 数 拟 
int front: 应 指示 队 头 ， 称 为 队 头 指针 */ 
int rear; 履 指 示 队 尾 ， 称 为 队 尾 指 针 */ 

}SqQueue; 


【函数 】 创 建 一 个 空 的 循环 队列 。 


int InitQueue(SqQueue *Q) 
此 创建 容量 为 MAXQSIZE 的 空 队 列 ， 若 成 功 返 回 9， 否则 返回 -1*/ 
{ Q~> base= (int*)malloc(MAXQSIZE*sizeof(int)): 
1f (1Q->base) retum —1:; 
Q->front = 0; Q->rear = 0; return 0; 
}/*InitQueue*/ 


通 :os 荐 。 软 人 设计 师 教 程 (第 5 版 ) 


【函数 】 元 素 入 循环 队列 。 


int EnQueue(SqQueue *Q, int e) /* 元 素 e 入 队 ， 若 成 功 返 回 0， 否 则 返回 -1#/ 
{ Hf((Q->reartl)% MAXQSIZE 一 Q->front) retur —1; 

Q->base[Q->rear] =e: 

Q->rear = (Q->rear + 1)% MAXQSIZE; 

return 0; 
}/*EnQueue*/ 


【函数 】 元 素 出 循环 队列 。 


int DelQueue(SqQueue *Q, int *e) 
# 若 队列 不 空 ， 则 删除 队 头 元 素 ， 由 参数 e 带 回 其 值 并 返回 0， 否 则 返回 -1*/ 
{ if(Q->rear 一 Q->front) retum 一 1; 


*e = Q->base[Q->front]; i .el 
Q->front = (Q->front + 1)% MAXQSIZE : 
ji Q.front 

}/*DelQueue*/ 

(2) 队列 的 链 式 存储 。 队 列 的 链 式 存储 也 称 为 链 队 列 。 这 里 © 队 头 


为 了 便于 操作 ， 给 链 队列 添加 一 个 头 结 点 ， 并 令 头 指针 指向 头 结 
点 。 因 此 ， 队 列 为 空 的 判定 条 件 是 头 指 针 和 尾 指针 的 值 相同 ， 且 


均 指向 头 结 点 。 队 列 的 一 种 链 式 存储 如 图 3.9 所 示 。 
3) 队列 的 应 用 Qrear -| 。 以 尾 


队列 结构 常用 于 处 理 需 要 排队 的 场合 ， 例 如 操作 系统 中 处 理 
打印 任务 的 打印 队列 、 离 散 事件 的 计算 机 模拟 等 。 


303 不 


图 3-9 链 队列 示意 图 


串 《〈 字 符 串 ) 是 一 种 特殊 的 线性 表 ， 其 数据 元 素 为 字符 。 计 算 机 中 非 数 值 问题 处 理 的 对 象 经 
常 是 字符 串 数据 ， 例如， 在 汇编 和 高 级 语言 的 编译 程序 中 ， 源 程序 和 目标 程序 都 是 字符 早 ， 在 事务 
处 理 程序 中 ， 姓名、 地址 等 一 般 也 是 作为 字符 串 处 理 的 。 串 具有 自身 的 特性 ， 运 算 时 常常 把 一 个 串 
作为 一 个 整体 来 处 理 。 这 里 介绍 串 的 定义 、 基 本 运算 、 存 储 结构 及 串 的 模式 匹配 算法 。 

1. 串 的 定义 及 基本 运算 


1) 串 的 定义 
串 是 仅 由 字符 构成 的 有 限 序列 ， 是 一 种 线性 表 。 一 般 记 为 S- aia…a' ， 其 中 ，S 是 串 名 


单 引号 括 起 来 的 字符 序列 是 串 值 。 
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2) 串 的 几 个 基本 概念 


空 串 : 长 度 为 零 的 串 称 为 空 串 ， 空 串 不 包含 任何 字符 。 

空格 串 : 由 一 个 或 多 个 空格 组 成 的 串 。 虽然 空格 是 一 个 空白 字符 , 但 它 也 是 一 个 字符 ， 
在 计算 串 长 度 时 要 将 其 计算 在 内 。 

子 串 :由 串 中 任意 长 度 的 连续 字符 构成 的 序列 称 为 子囊。 含有 子 串 的 串 称 为 主 串 。 子 
串 在 主 串 中 的 位 置 是 指 子 串 首次 出 现时 ， 该 子 串 的 第 一 个 字符 在 主 串 中 的 位 置 。 空 串 
是 任意 串 的 子 串 。 

串 相等 ; 指 两 个 串 长 度 相等 且 对 应 序号 的 字符 也 相同 。 

串 比 较 : 两 个 串 比 较 大 小 时 以 字符 的 ASCII 码 值 (或 其 他 字符 编码 集合 ) 作为 依据 。 
实质 上 ， 比 较 操 作 从 两 个 串 的 第 一 个 字符 开始 进行 ， 字 符 的 码 值 大 者 所 在 的 串 为 大 
若 其 中 一 个 串 先 结束 ， 则 以 串 长 较 大 者 为 大 。 


3) 串 的 基本 操作 

(1) 赋值 操作 StrAssign(s,t): 将 串 s 的 值 赋 给 串 t。 

(2) 连接 操作 Concat(s,t): 将 串 t 接 续 在 串 s 的 尾部 ， 形 成 一 个 新 串 。 

(3) 求 串 长 StLength(s): 返回 串 s 的 长 度 。 

(4) 串 比较 StCompare(s,t): 比较 两 个 串 的 大 小 。 返 回 值 -1、0 和 1 分 别 表示 s<t、s=t 和 
s>t 三 种 情况 。 

(5) 求 子 串 SubString(s,start,len): 返回 串 s 中 从 start 开始 的 、 长 度 为 len 的 字符 序列 。 

以 上 5 种 最 基本 的 串 操 作 构 成 了 串 的 最 小 操作 子 集 ， 利 用 它们 可 以 实现 串 的 其 他 运算 。 


2， 串 的 存储 结构 


串 可 以 进行 顺序 存储 或 链 式 存储 。 

(1) 串 的 顺序 存储 结构 。 串 的 顺序 存储 结构 是 指 用 一 组 地 址 连续 的 存储 单元 来 存储 串 值 的 
字符 序列 。 由 于 串 中 的 元 素 为 字符 ， 所 以 可 通过 程序 语言 提供 的 字符 数组 定义 串 的 存储 空间 ， 
也 可 以 根据 串 长 的 需要 动态 申请 字符 串 的 空间 。 

(2) 串 的 链 式 存储 。 当 用 链表 存储 串 中 的 字符 时 ， 每 个 结 点 中 可 以 存储 一 个 字符 ， 也 可 以 
存储 多 个 字符 ， 此 时 要 考虑 存储 密度 问题 。 在 链 式 存储 结构 中 ， 结 点 大 小 的 选择 会 直接 影响 对 
串 的 处 理 效率 。 


3 串 的 模式 匹配 


子 串 的 定位 操作 通常 称 为 串 的 模式 匹配 ， 它 是 各 种 串 处 理 系统 中 最 重要 的 运算 之 一 。 子 串 
也 称 为 模式 串 。 
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1) 朴素 的 模式 匹配 算法 

该 算法 也 称 为 布 鲁 特 一 福 斯 算法 ,其 基本 思想 是 从 主 串 的 第 一 个 字符 起 与 模式 串 的 第 一 个 
字符 比较 ， 若 相等 ， 则 继续 逐一 对 字符 进行 后 续 的 比较 ， 否 则 从 主 串 第 二 个 字符 起 与 模式 串 的 
第 一 个 字符 重新 比较 ， 直 到 模式 串 中 每 个 字符 依次 和 主 串 中 一 个 连续 的 字符 序列 相等 时 为 止 ， 
此 时 称 为 匹配 成 功 。 如 果 不 能 在 主 串 中 找到 与 模式 串 相同 的 子囊 ， 则 匹配 失败 。 

【函数 】 以 字符 数组 存储 字符 串 ， 实 现 朴素 的 模式 匹配 算法 。 

int Index(char S[], char T[], int pos) 

证 查 找 并 返回 模式 串 工 在 主 串 S$ 中 从 pos 开始 的 位 置 (下 标 )， 若 工 不 是 S 的 子 串 ， 则 返回 -1*/ 

族 模 式 申 荆 和 主 串 S 第 一 个 字符 的 下 标 为 0*/ 


{ int 1,], slen, tlen; 


i=pos; j=0; /是 、j 分 别 用 于 指出 主 串 字 符 和 模式 串 字 符 的 位 置 */ 
slen = strlen(S); tlen = strlen(T): 旋 计 算 主 串 和 模式 串 的 长 度 */ 
while (1 < slen && ] < tlen){ 
(SE = TO {it+t; j++:} 
else { 
i=i-j+1; 族 主 串 字 符 的 位 置 指针 回 退 */ 
j= 
} 


} /*while*/ 
1f(j>=tlen) returni- tlen; 
returm 一 1; 
}/# Index */ 
假设 主 串 和 模式 串 的 长 度 分 别 为 n 和 m， 位 秆 序号 从 0 开始 计算 ， 下 面 分 析 朴 素 模式 匹配 
算法 的 时 间 复 杂 度 。 设 从 主 串 的 第 i 个 位 置 开始 与 模式 串 匹 配 成 功 , 且 在 前 i 赵 匹 配 中 (位 置 0 一 
区 1)， 每 趟 不 成 功 的 匹配 都 是 模式 串 的 第 一 个 字符 与 主 串 中 相应 的 字符 不 相同 ， 则 在 前 i 趟 下 
配 中 ， 字 符 的 比较 共 进 行 了 i 次 ， 而 第 计 1 趟 《〈 从 位 置 站 开 始 ) 成 功 匹 配 的 字符 比较 次 数 为 m 
所 以 总 的 字符 比较 次 数 为 itm(0<i<n-m). 若 在 主 串 的 mn-m 个 起 始 位 置 上 匹配 成 功 的 概率 相同 ， 
则 在 最 好 情况 下 ， 匹 配 成 功 时 字符 间 的 平均 比较 次 数 为 


FpG+m= 


tt 
因此 ， 在 最 好 情况 下 匹配 算法 的 时 间 复 杂 度 为 O(ntm)。 
而 在 最 坏 情 况 下 ,每 一 趟 不 成 功 的 匹配 都 是 模式 串 的 最 后 一 个 字符 与 主 串 中 相应 的 字符 不 
相等 ， 则 主 捉 中 新 一 趟 匹配 过 程 的 起 始 位 置 为 im+2。 设 从 主 串 的 第 i 个 字符 开始 匹配 时 成 功 ， 
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则 在 前 i 趋 不 成 功 的 匹配 中 ,每 趟 都 比较 了 m 次 ,总共 比 较 了 iXm 次 , 第 计 1 趟 的 成 功 匹配 也 
比较 了 m 次 。 因 此 ， 最 坏 情况 下 的 平均 比较 次 数 为 


二 


5 m 
ZPD 计 mi 

通常 情况 下 ， 由 于 n>>m， 所 以 该 算法 在 最 坏 情 况 下 的 时 间 复 杂 度 为 O(n Xm)。 

2) 改进 的 模式 匹配 算法 

改进 的 模式 匹配 算法 又 称 为 KMP 算法 ， 其 改进 之 处 在 于 : 每 当 匹 配 过 程 中 出 现 相 比 较 的 
字符 不 相等 时 ， 不 需要 回 退 主 串 的 字符 位 置 指 针 ， 而 是 利用 已 经 得 到 的 “部 分 匹配 ”结果 将 模 
式 串 向 右 “ 滑 动 ” 尽 可 能 远 的 距离 ， 再 继续 进行 比较 。 

设 模 式 串 为 "po…pm1"，KMP 匹配 算法 的 思想 是 ， 当 模式 串 中 的 字符 pj 与 主 串 中 相应 的 字 
符 5; 不 相等 时 , 因 其 前 j 个 字符 ("po…pja") 已 经 获得 了 成 功 的 匹配 , 所 以 若 模式 串 中 的 "po…Pei 
与 和 pjx…pja" 相 同 ， 这 时 可 令 pi 与 5; 进 行 比较 ， 从 而 使 i 无 须 回 退 。 

在 KMP 算法 中 ， 依 据 模式 串 的 next 函数 值 实现 子 串 的 滑动 。 若 令 next[]=k， 则 nextD] 表 
示 当 模式 串 中 的 pj 与 主 串 中 相应 字符 不 相等 时 ， 令 模式 串 的 poew 与 主 串 的 相应 字符 进行 比较 。 

next 函数 的 定义 如 下 : 


6 二 mn- 到 


= 当 j CE 0 时 
next[ 门 =1max {|0<k<jH"poprea"="pj ep"} 
0 ”其 他 情况 
【函数 】 求 模式 串 的 next 函数 。 
void Get_next(char *p, int next[]) A* 求 模式 串 p 的 next 函数 值 并 存 入 数组 next*/ 


{ inti,]j, slen; 
slen = strlen(p):; i= 0; 
next[0] = —1:; j=—1; 
while(i < slen) { 
让 4 一 一 |p 国 一 pD]) {Hi :next 加 =j:} 
else j = next[j]; 
jwhiles/ 
}/*Get_next*/ 
【函数 】KMP 模式 匹配 算法 ， 设 模式 串 第 一 个 字符 的 下 标 为 0。 
int Index KMP(char *s, char *p, int pos, int next[]) 
人 # 利 用 模式 串 p 的 next 函数 ， 求 p 在 主 串 s 中 从 第 pos 个 字符 开始 的 位 置 */ 
人 # 若 匹配 成 功 ， 返 回 模式 串 在 主 串 中 的 位 置 〔《 下 标 )， 和 否则 返回 -1%/ 
{ intl j, slen, plen: 
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i=pos—l; 
j=-l; 
slen = strlen(s); plen = strlen(p); 
while (1 < slen && j <plen ) { 
下 6 一 -1s 国 一 pDD {HiHj;} 
elsej = next[]; 
Y/*while*/ 
1f (J>=plen) return i - plen; 
else return 一 1; 
}/*Index KMP*/ 
例如 ， 设 主 串 为 “abacbcabababbcbc”， 模 式 串 为 “abababb”， 且 模式 串 的 next 函数 值 如 下 
表 所 示 ， 则 KMP 算法 的 匹配 过 程 如 图 3-10 所 示 。 其 中 ，i 是 主 串 字符 的 下 标 , j 是 模式 串 字符 
的 下 标 。 


9 3 7 8 9 101112131415 
主 昌 9S a bac bababbecbe 
人 
1 
0 1 3435 6 
模式 串 P a b a b a b b 
4 
J 
1234556 
J 
0123456 
模式 叫 P aba b a b b 
4 
J 
(a) 
01234567 89101112131415 
主帅 S a bacbcabababbecbec 
4 
刘 
912 3 
模式 串 P a ba b a bb 
4 
J 
(b) 


图 3-10 KMP 模式 匹配 过 程 示意 图 
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第 一 趟 匹配 从 S[0] 与 PLO] 开 始 。 由 于 S[0] 一 P[0]、5S[7] 一 P[7]、S[2] 一 P[2]， 所 以 接 下 来 比 
较 S[3] 与 P[3], 由 于 S[3] 与 P[3] 不 相等 , 所 以 第 一 趟 结束 ， 要 进行 第 二 趟 匹配 , 令 产 next[3] ( 即 
广 1)。 第 二 趟 从 S[3] 与 P[7] 开 始 比较 ， 仍 不 相等 ， 因 此 第 二 趟 结束 ， 要 进行 第 三 趟 匹配 ， 所 以 
令 next[1]〈 即 广 0)。 第 三 趟 从 S[3] 与 P[O] 开 始 比较 ， 如 图 3-10 〈a) 所 示 。 由 于 5S[3] 与 P[O] 
不 相等 ， 所 以 令 j=next[0]( 即 产 -1)， 此 时 满足 条 件 “7 一 -1”， 显然 不 能 令 5S[3] 与 P[-7] 进 行 
比较 ， 说 明 主 串 中 从 i=3 开始 的 子 串 不 可 能 与 模式 串 相同 ， 因 此 需要 将 i 的 值 递增 后 再 继续 进 
行 匹配 过 程 ， 即 令 计 +、j++， 然 后 下 一 趟 从 S[4] 与 P[0] 开 始 比 较 ， 如 图 3-10 (b) 所 示 ， 继 续 
匹配 过 程 。 直 到 某 一 趟 匹配 成 功 ， 或 者 由 于 在 主 串 中 找 不 到 模式 串 而 以 失败 结束 。 


3.2 数组、 矩阵 和 广义 表 


数组 与 广义 表 可 看 作 是 线性 表 的 推广 ， 其 特点 是 数据 元 素 仍然 是 一 个 表 。 这 里 讨论 多 维 数 
组 的 逻辑 结构 和 存储 结构 ， 特 殊 和 矩阵 和 和 矩阵 的 压缩 存储 ， 广 义 表 的 逻辑 结构 、 存 储 结构 和 基本 
运算 。 


3.2.1 数组 
1. 数组 的 定义 及 基本 运算 


1) 数组 的 定义 

数组 是 定 长 线性 表 在 维 数 上 的 扩展 ， 即 线性 表 中 的 元 素 又 是 一 个 线性 表 。n 维 数组 是 一 种 
“ 同 构 ” 的 数据 结构 ， 其 每 个 数据 元 素 类 型 相同 、 结 构 一 致 。 

设 有 n 维 数组 4[b,b,,…,b,] ， 其 每 一 维 的 下 界 都 为 1，6b; 是 第 i 维 的 上 界 。 从 数据 结构 的 
迪 辑 关系 角度 来 看 ，4 中 的 每 个 元 素 4[ 六 , 广 ,…, 记 ] (1<ji<bi) 都 被 n 个 关系 所 约束 。 在 每 个 
关系 中 ， 除 第 一 个 和 最 后 一 个 元 素 外 ， 其 余 元 素 都 只 有 一 个 直接 后 继 和 一 个 直接 前 驱 。 因 此 就 
单个 关系 而 言 ， 它 仍 是 线性 的 。 

以 二 维 数组 4[m, 由 为 例 , 可 以 把 它 看 成 是 一 个 定 长 的 线性 表 , 它 的 每 个 元 素 也 是 一 个 定 长 


dn. Wa am 
_|9a2 az 023 Gn 

4 = : 
Gm Gm2 Gm3 “~ Gmmn 


了 4 可 看 成 一 个 行 向 量 形 式 的 线性 表 : 
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i =[[auo2…an] ,[aaa2…a] 由 
或 列 向 量 形式 的 线性 表 : 
i = aa aia “al | 
(1) 数据 元 素数 目 固定 ， 一 旦 定义 了 一 个 数组 结构 ， 就 不 再 有 元 素 个 数 的 增 减 变化 。 
(2) 数据 元 素 具有 相同 的 类 型 。 
(3) 数据 元 素 的 下 标 关 系 具 有 上 下 界 的 约束 且 下 标 有 序 。 
2) 数组 的 两 个 基本 运算 
(1) 给 定 一 组 下 标 ， 存 取 相 应 的 数据 元 素 。 
(2) 给 定 一 组 下 标 ， 修 改 相应 的 数据 元 素 中 某 个 数据 项 的 值 。 
所 有 的 高 级 程序 设计 语言 都 提供 了 数组 类 型 。 实 际 上 ， 在 程序 语言 中 把 数组 看 成 是 具有 共 
同名 字 的 同一 类 型 的 多 个 变量 的 集合 。 


2. 数组 的 顺序 存储 

数组 一 般 不 做 插入 和 删除 运算 ,一 旦 定义 了 数组 ， 则 结构 中 的 数据 元 素 个 数 和 元 素 之 间 的 
关系 就 不 再 发 生变 动 ， 因 此 数组 适合 于 采用 顺序 存储 结构 。 

二 维 数组 的 存储 结构 可 分 为 以 行为 主 序 和 以 列 为 主 序 的 两 种 方法 ， 如 图 3-11 所 示 。 


El 
第 一 行 1 > 第 一 列 
二 
[|| 
二 行 | :| 
J 
:| 
EE 
第 m 行 4 > 第 n 列 
| 


图 3-11 二 维 数组 的 两 种 存储 方式 
设 每 个 数据 元 素 占用 工 个 单元 ， m、n 为 数组 的 行 数 和 列 数 ，Loc(an) 表 示 元 素 aa 的 地 址 ， 
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那么 以 行为 主 序 优 先 存储 的 地 址 计算 公式 为 
Loc(ay)=Loc(a)+((G—D)Xn+0-1) XL 
同 理 ， 以 列 为 主 序 优先 存储 的 地 址 计算 公式 为 
Loc(ay)=Loc(a)+(0-DXm+(i-1) XL 
推广 至 多 维 数组 ， 在 按 下 标 顺 序 存储 时 ， 先 排 最 右 的 下 标 ， 从 右 向 左 直到 最 左下 标 ， 而 逆 
下 标 顺序 则 正好 相反 。 


3.2.2 ”矩阵 


矩阵 是 很 多 科学 与 工程 计算 领域 研究 的 数学 对 象 。 在 数据 结构 中 ， 主 要 讨论 如 何在 节省 存 
储 空间 的 情况 下 使 矩阵 的 各 种 运算 能 高 效 地 进行 。 

在 一 些 矩 阵 中 ， 存 在 很 多 值 相 同 的 元 素 或 者 是 0 元 素 。 为 了 节省 存储 空间 ， 可 以 对 这 类 和 拢 
阵 进 行 压缩 存储 ， 即 为 多 个 值 相 同 的 元 素 只 分 配 一 个 存储 单元 ， 对 0 不 分 配 存储 单元 。 假 如 值 
相同 的 元 素 或 0 元 素 在 矩阵 中 的 分 布 有 一 定 的 规律 ， 则 称 此 类 矩阵 为 特殊 窍 阵 ， 否 则 称 其 为 稀 
政 和 矩阵。 


1， 特 殊 矩 阵 


若 矩 阵 中 元 素 (或 非 0 元 素 ) 的 分 布 有 一 定 的 规律 ， 则 称 之 为 特殊 矩阵 。 常 见 的 特殊 矩阵 
有 对 称 矩 了 泗 、 三 角 和 矩阵 和 对 角 和 矩阵 等 。 对 于 特殊 和 矩阵， 由 于 其 非 0 元 素 的 分 布 有 一 定 的 规律 ， 
所 以 可 将 其 压缩 存储 在 一 维 数组 中 ， 并 建立 起 每 个 非 0 元 素 在 矩阵 中 的 位 置 与 其 在 一 维 数组 中 
的 位 置 之 间 的 对 应 关系 。 

若 和 矩阵 4ww 中 的 元 素 特点 为 qaj(1<i,j<n) ， 则 称 之 为 n 阶 对 称 矩 阵 。 

若 对 称 矩 阵 中 的 每 一 对 元 素 仅 占用 一 个 存储 单元 ， 那 么 可 将 m 个 元 素 压缩 存储 到 能 存放 
n(n+1)/2 个 元 素 的 存储 空间 中 。 不 失 一 般 性 ， 以 行为 主 序 存储 下 三 角 (包括 对 角 线 ) 中 的 元 素 。 
假设 以 一 维 数组 B[n(n+1)/2] 作 为 n 阶 对 称 和 矩阵 4 中 元 素 的 存储 空间 ， 则 B[ 有 (1<k<n(n+1)/2) 与 
矩阵 元 素 ay (aj) 之 间 存 在 着 一 一 对 应 的 关系 ， 如 下 所 示 。 

Ec j i>j 
二 上 这 
205-0 1 i<j 

对 角 抵 阵 是 指 矩阵 中 的 非 0 元 素 都 集中 在 以 主 对 角 线 为 中 心 的 带 状 区 域 中 , 即 除 了 主 对 角 

线 上 和 直接 在 对 角 线 上 、 下 方 若 干 条 对 角 线 上 的 元 素 外 ， 其 余 的 矩阵 元 素 都 为 0。 一 个 n 阶 的 
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三 对 角 和 矩阵 如 图 3-12 所 示 。 

车 以 行为 主 序 将 n 阶 三 对 角 和 矩阵 4,xw 的 非 0 元 素 ay 存 储 在 一 维 数组 B[A(1<k<3Xn-2) 中 ， 
则 元 素 位 置 之 间 的 对 应 关系 为 

k=3X(i-—D-l+j-i+l+1l=2i+j-—2 (1gi, jn) 

其 他 特殊 窍 阵 可 做 类 似 的 推算 ， 这 里 不 再 一 一 说 明 。 

2， 稀 疏 和 矩阵 

在 一 个 矩阵 中 ,若非 0 元 素 的 个 数 远 远 少 于 0 元 素 的 个 数 ， 且 非 0 元 素 的 分 布 没有 规律 ， 
则 称 之 为 稀 玻 矩阵 。 对 于 稀 玻 窍 阵 ， 存 储 非 0 元 素 时 必须 同时 存储 其 位 置 〈 即 行 号 和 列 号 )， 
所 以 三 元 组 (i, j, ay) 可 唯一 确定 矩阵 4 中 的 一 个 元 素 。 由 此 ， 一 个 稀 朴 矩阵 可 由 表示 非 0 元 
素 的 三 元 组 及 其 行 、 列 数 唯一 确定 。 图 3-13 所 示 的 是 一 个 6 行 7 列 的 稀 玻 窍 阵 ， 其 三 元 组 表 为 
((1,2,12), (1,3,9), (3,1,—3), (3,6,14), (4,3,24), (5,2,18), (6,1,15), (6,4,—7))。 


yg 


aq21 022 023 0 0129 0 0 0 0 

032 (33 (3.4 0 0 0000 

Ws SEE Maoo%。ool4o0 

i 遇 | 售 |o 024 0000 

. 0 18 0 0 .000 

i 15 0 0 -7000 

图 3-12 三 对 角 矩 阵 示意 图 图 3-13 稀 跑 矩阵 示意 图 

稀 芷 矩阵 的 三 元 组 表 的 顺序 存储 结构 称 为 三 元 组 顺序 表 ,， 常用 的 三 元 组 表 的 链 式 存储 结构 
是 十 字 链 表 。 

S23 了 义 表 


广义 表 是 线性 表 的 推广 ， 是 由 0 个 或 多 个 单元 素 或 子 表 组 成 的 有 限 序列 。 
广义 表 与 线性 表 的 区 别 在 于 : 线性 表 的 元 素 都 是 结构 上 不 可 分 的 单元 素 ， 而 广义 表 的 元 素 
既 可 以 是 单元 素 ， 也 可 以 是 有 结构 的 表 。 
广义 表 一 般 记 为 
LS= (oo oo) 
其 中 ，w (1<i<n) 既 可 以 是 单个 元 素 ， 又 可 以 是 广义 表 ， 分 别称 为 原子 和 子 表 。 
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广义 表 的 长 度 是 指 广义 表 中 元 素 的 个 数 。 广 义 表 的 深度 是 指 广义 表 展 开 后 所 含 的 括号 的 最 
大 层 数 。 
1. 广义 表 的 基本 操作 


与 线性 表 类 似 ， 广 义 表 也 有 查找 、 插 入 和 删除 等 操作 。 由 于 广义 表 的 结构 较 复杂 ， 其 各 种 
运算 的 实现 也 不 如 线性 表 简单 ， 这 里 只 讨论 两 个 重要 的 运算 。 

(1) 取 表 头 head(LS)。 非 空 广 义 表 LS 的 第 一 个 元 素 称 为 表 头 ， 它 可 以 是 一 个 单元 素 ， 也 
可 以 是 一 个 子 表 。 

(2) 取 表 尾 tail(LS)。 在 非 空 广义 表 中 ， 除 表 头 元 素 之 外 ， 由 其 余 元 素 所 构成 的 表 称 为 表 
尾 。 非 空 广义 表 的 表 尾 必定 是 一 个 表 。 

2， 广义 表 的 特点 


(1) 广义 表 可 以 是 多 层次 的 结构 ， 因 为 广义 表 的 元 素 可 以 是 子 表 ， 而 子 表 的 元 素 还 可 以 是 
子 表 。 

(2) 广义 表 中 的 元 素 可 以 是 已 经 定义 的 广义 表 的 名 字 ， 所 以 一 个 广义 表 可 被 其 他 广义 表 所 
共享。 

(3) 广义 表 可 以 是 一 个 递归 的 表 ， 即 广义 表 中 的 元 素 也 可 以 是 本 广义 表 的 名 字 。 

3. 广义 表 的 存储 结构 


由 于 广义 表 中 的 元 素 本 身 又 可 以 具有 结构 ， 它 是 一 种 带 有 层次 的 非 线 性 结构 ， 因 此 难以 用 
顺序 存储 结构 表示 ， 通 常 采用 链 式 存储 结构 。 由 上 面 的 讨论 可 知 ， 若 广义 表 不 空 ， 则 可 分 解 为 
表 头 和 表 尾 两 部 分 。 反 之 ， 一 对 确定 的 表 头 和 表 尾 可 唯一 确定 一 个 广义 表 。 针 对 原子 和 子 表 可 
分 别 设计 不 同 的 结 点 结构 ， 如 图 3-14 所 示 。 对 于 广义 表 LS=(a,(b,c,d))， 其 链 式 存储 结构 如 图 
3-15 所 示 。 


as- hp | wm | LS 下 [4—[ ne 


表 结 点 


NE 


元 素 结 点 ols Lole of a 


己 | 


tag=0 | data Lo a 加 


图 3-14 广义 表 的 链表 结 点 结构 图 3-15 广义 表 (a,(b,c,d)) 的 存储 结构 示意 图 
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3.3 树 


树 结构 是 一 种 非常 重要 的 非 线 性 结构 ， 该 结构 中 的 一 个 数据 元 素 可 以 有 两 个 或 两 个 以 上 的 
直接 后 继 元 素 ， 树 可 以 用 来 描述 客观 世界 中 广泛 存在 的 层次 结构 关系 。 


3.3.1 树 与 二 叉 树 的 定义 
1. 树 的 定义 


树 是 xz> 0) 个 结 点 的 有 限 集合 ， 当 n=0 时 称 为 空 树 。 在 任 一 非 空 树 (n>0) 中 ， 有 且 仅 有 一 
个 称 为 根 的 结 点 ， 其 余 结 点 可 分 为 m(m>0) 个 互 不 相交 的 有 限 子 集 ,TL…,T,， 其 中 ， 每 个 ZT 
又 都 是 一 棵 树 ， 并 且 称 为 根 结 点 的 子 树 。 

树 的 定义 是 递归 的 ， 它 表明 了 树 本 身 的 固有 特性 ， 也 就 是 一 棵 树 由 若干 棵 子 树 构成 ， 而 子 
树 又 由 更 小 的 子 树 构 成 。 

该 定义 只 给 出 了 树 的 组 成 特点 ， 若 从 数据 结构 的 逻辑 关系 角度 来 看 ， 树 中 元 素 之 问 有 严格 
的 层次 关系 。 对 于 树 中 的 某 个 结 点 ， 它 最 多 只 和 上 一 层 的 一 个 结 点 《〈 即 其 双亲 结 点 ) 有 直接 的 
关系 ， 而 与 其 下 一 层 的 多 个 结 点 〈 即 其 孩子 结 点 ) 有 直接 关系 ， 如 图 3-16 所 示 。 通 常 ， 凡 是 分 
等 级 的 分 类 方案 都 可 以 用 具有 严格 层次 关系 的 树 结构 来 描述 。 


(4) 
(3) (© 


© 
(E) © © 


图 3-16 树 结构 示意 图 


2. 树 的 基本 概念 


(1) 双亲 、 孩 子 和 兄弟 。 结 点 的 子 树 的 根 称 为 该 结 点 的 孩子 ， 相 应 地 ， 该 结 点 称 为 其 子 结 
点 的 双亲 。 具 有 相同 双亲 的 结 点 互 为 兄弟 。 

(2) 结 点 的 度 。 一 个 结 点 的 子 树 的 个 数 记 为 该 结 点 的 度 。 例如， 图 3-16 中 ，A 的 度 为 3 
B 的 度 为 2，C 的 度 为 0，D 的 度 为 1。 

(3) 叶子 结 点 。 叶 子 结 点 也 称 为 终端 结 点 ， 指 度 为 0 的 结 点 。 例 如 ， 图 3-16 中 ，E、F、 
C、G 都 是 叶子 结 点 。 

(4) 内 部 结 点 。 度 不 为 0 的 结 点 ， 也 称 为 分 支 结 点 或 非 终端 结 点 。 除 根 结 点 以 外 ， 分 支 结 
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点 也 称 为 内 部 结 点 。 例 如 ， 图 3-16 中 ，B、D 都 是 内 部 结 点 。 
(5) 结 点 的 层次 。 根 为 第 一 层 ， 根 的 孩子 为 第 二 层 ， 依 此 类 推 , 若 某 结 点 在 第 i 层 ， 则 其 
孩子 结 点 在 第 寺 1 层 。 例如， 图 3-16 中 ，A 在 第 1 层 ，B、C、 DD 在 第 2 层 ,， E、F 和 G 在 


第 3 层 。 
(6) 树 的 高 度 。 一 棵 树 的 最 大 层 数 记 为 树 的 高 度 〈 或 深度 )。 例 如 ， 图 3-16 所 示 树 的 
高 度 为 3。 


(7) 有 序 〈 无 序 ) 树 。 若 将 树 中 结 点 的 各 子 树 看 成 是 从 左 到 右 具 有 次 序 的 ， 即 不 能 交换 ， 
则 称 该 树 为 有 序 树 ， 否 则 称 为 无 序 树 。 


3. 二 又 树 的 定义 


二 又 树 是 n(m>0) 个 结 点 的 有 限 集合 ， 它 或 者 是 空 树 (n=0)， 或 者 是 由 一 个 根 结 点 及 两 棵 
不 相交 的 且 分 别称 为 左 、 右 子 树 的 二 又 树 所 组 成 。 可 见 ， 二 又 树 同 样 具 有 递归 性 质 。 

需要 特别 注意 的 是 ， 尽 管 树 和 二 又 树 的 概念 之 间 有 许多 联系 ， 但 它们 是 两 个 不 同 的 概念 。 
树 和 二 又 树 之 间 最 主要 的 区 别 是 : 二叉树 中 结 点 的 子 树 要 区 分 左 子 树 和 右 子 树 ， 即 使 在 结 点 内 
有 一 棵 子 树 的 情况 下 ， 也 要 明确 指出 该 子 树 是 左 子 树 还 是 右 子 树 。 另 外 ， 二 叉 树 结 点 最 大 度 为 
2， 而 树 中 不 限制 结 点 的 度数 ， 如 图 3-17 所 示 。 


@ 心 Q 
@ © ORG ® © 
© © © 
(a) 二 叉 树 (b) 二 叉 树 中 结 点 B (ec) 二 叉 树 中 结 点 B (d) 普通 树 中 结 点 B 
的 左 子 树 为 空 的 右 子 树 为 空 有 一 棵 子 树 


图 3-17 二 又 树 与 普通 树 


3.3.2 ”一 叉 树 的 性 质 与 存储 结构 


1. 二 叉 树 的 性 质 
(1) 二 叉 树 第 i 层 (i>1) 上 最 多 有 2 站 个 结 点 。 


此 性 质 只 要 对 层 数 i 进 行 数学 归纳 证 明 即 可 。 
(2) 高 度 为 大 的 二 叉 树 最 多 有 24_1 个 结 点 (k> 1)。 
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天 
由 性 质 1， 每 一 层 的 结 点 数 都 取 最 大 值 > 2 ”=2 一 1 即 可 。 


(3) 对 于 任何 一 棵 二 叉 树 ， 若 其 终端 结 点 数 为 mw， 度 为 2 的 结 点 数 为 np， 则 no=nzt1。 

(4) 具有 个 结 点 的 完全 二 叉 树 的 深度 为 | logn |+1。 

若 深 度 为 的 二 叉 树 有 2" -1 个 结 点 ， 则 称 其 为 满 二 又 树 。 可 以 对 满 二 又 树 中 的 结 点 进行 
连续 编号 : 约定 编号 从 根 结 点 起 ， 自 上 而 下 、 自 左 至 右 依次 进行 。 深 度 为 上 及 个 结 点 的 二 
又 树 ， 当 且 仅 当 其 每 一 个 结 点 都 与 深度 为 大 的 满 二 又 树 中 编号 从 1 至 的 结 点 一 一 对 应 时 ， 称 
之 为 完全 二 又 树 。 满 二 又 树 如 图 3-18 〈a) 所 示 ， 高 度 为 3 的 一 个 完全 二 又 树 如 图 3-18 (b) 
所 示 。 

在 一 个 高 度 为 的 完全 二 叉 树 中 ,除了 第 层 ( 即 最 后 一 层 )， 其 余 各 层 都 是 满 的 。 在 第 
层 上 的 结 点 必须 从 左 到 右 依 次 放置 ， 不 能 留 空 。 图 3-18 (c) 所 示 的 二 又 树 不 是 完全 二 又 树 ， 
因为 6 号 结 点 的 左边 有 空 结 点 。 


(a) 满 二 又 树 (b) 完全 二 叉 树 (ce) 非 完全 二 叉 树 
图 3-18 满 二 又 树 和 完全 二 又 树 示意 图 


2. 二 又 树 的 存储 结构 


1) 二 又 树 的 顺序 存储 结构 

顺序 存储 是 用 一 组 地 址 连续 的 存储 单元 存储 二 又 树 中 的 结 点 ， 必 须 把 结 点 排 成 一 个 适当 的 
线性 序列 ， 并 且 结 点 在 这 个 序列 中 的 相互 位 置 能 反映 出 结 点 之 间 的 逻辑 关系 。 

用 一 组 地 址 连续 的 存储 单元 存储 二 又 树 中 的 结 点 ， 必 须 把 结 点 排 成 一 个 适当 的 线性 序列 
并 且 结 点 在 这 个 序列 中 的 相互 位 置 能 反映 出 结 点 之 间 的 逻辑 关系 .对 于 深度 为 大 的 完全 二 又 树 ， 
除 第 大 层 外 ， 其 余 各 层 中 含有 最 大 的 结 点 数 ， 即 每 一 层 的 结 点 数 恰 为 其 上 一 层 结 点 数 的 两 倍 ， 
由 此 从 一 个 结 点 的 编号 可 推 知 其 双亲 、 左 孩子 和 右 孩 子 的 编号 。 

假设 有 编号 为 i 的 结 点 ， 则 有 : 

。 车 庆 1， 则 该 结 点 为 根 结 点 ， 无 双亲 ; 若 六 1， 则 该 结 点 的 双亲 结 点 为 |;/2| 。 

。 车 2igxn， 则 该 结 点 的 左 孩子 编号 为 2?， 否 则 无 左 孩子 。 
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。 若 2it1sn， 则 该 结 点 的 右 孩 子 编号 为 2i+1， 否 则 无 右 孩 子 。 

完全 二 又 树 的 顺序 存储 结构 如 图 3-19 (a》 所 示 。 

显然 ， 完 全 二 叉 树 采 用 顺序 存储 结构 既 简 单 又 节省 空间 ， 对 于 一 般 的 二 叉 树 ， 则 不 宜 采 用 
顺序 存储 结构 。 因 为 一 般 的 二 叉 树 也 必须 按照 完全 二 叉 树 的 形式 存储 ， 也 就 是 要 添上 一 些 实际 
并 不 存在 的 “ 虚 结 点 ”， 这 将 造成 空间 的 浪费 ， 如 图 3-19 (b) 所 示 。 


(a) 完全 二 叉 树 (b) 一 般 二 叉 树 
图 3-19 二 叉 树 的 顺序 存储 结构 

在 最 坏 情况 下 ， 一 个 深度 为 上 且 只 有 下 个 结 点 的 二 又 树 〈 单 支 树 ) 需要 2-1 个 存储 单元 。 

2) 二 又 树 的 链 式 存储 结构 

由 于 二 又 树 的 结 点 中 包含 有 数据 元 素 、 左 子 树 的 根 、 右 子 树 的 根 及 双亲 等 信息 ， 因 此 可 以 
用 三 又 链表 或 二 又 链表 〈 即 一 个 结 点 含有 3 个 指针 或 两 个 指针 ) 来 存储 二 叉 树 ， 链 表 的 头 指针 
指向 二 又 树 的 根 结 点 ， 如 图 3-20 所 示 。 

H 


[an AIAIA| 


ee 


E [Als A[r 玉 人 
A 


(b) 二 叉 链表 (c) 三 叉 链表 
图 3-20 二 又 树 的 链表 存储 结构 


> 
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设 结 点 中 的 数据 元 素 为 整 型 ， 则 二 又 链表 的 结 点 类 型 定义 如 下 : 
typedef struct BiTnode{ 

int data; 

struct BiTnode *lchild,*rchild: 
}BiTnode,*BiTree; 


在 不 同 的 存储 结构 中 ， 实 现 二 又 树 的 运算 方法 也 不 同 ， 具 体 应 采用 什么 存储 结构 ， 除 考虑 
二 又 树 的 形态 外 还 应 考虑 需要 进行 的 运算 特点 。 


3.3.3 二叉树 的 遍历 


遍历 是 按 某 种 策略 访问 树 中 的 每 个 结 点 ， 且 仅 访问 一 次 的 过 程 。 由 于 二 又 树 所 具有 的 递归 
性 质 ， 一 棵 非 空 的 二 叉 树 是 由 根 结 点 、 左 子 树 和 右 子 树 三 部 分 构成 的 ， 因 此 若 能 依次 遍历 这 三 
部 分 ， 也 就 遍历 了 整 棵 二 又 树 。 按 照 先 遍历 左 子 树 后 遍历 右 子 树 的 约定 ， 根 据 访问 根 结 点 位 置 
的 不 同 , 可 得 到 二 叉 树 的 先 序 、 中 序 和 后 序 3 种 遍历 方法 。 此外， 对 二 叉 树 还 可 进行 层 序 遍 历 。 
【函数 】 二 又 树 的 先 序 遍历 。 
void PreOrder(BiTree root){ 
if (root != NULL) { 
Pprintf("%d", root->data); 
PreOrder(root->lchild): 
PreOrder(root->rchild); 
/xifw/ 
}/*PreOrder*/ 


【函数 】 二 又 树 的 中 序 遍 历 。 


void InOrder(BiTree root){ 
if (root (= NULL) { 


雍 访 问 根 结 点 */ 
人 # 先 序 遍历 根 结 点 的 左 子 树 所 
刻 先 序 遍 历 根 结 点 的 右 子 树 */ 


InOrder(root->lchild); 


Printf("%d", root->data): 


JInOrder(root->rchild): 
Jifw/ 
HW*InOrder*/ 
【函数 】 二 又 树 的 后 序 遍 历 。 


void PostOrder(BiTree root){ 
if (root != NULL) { 


证 中 序 遍 历 根 结 点 的 左 子 树 */ 
人 # 访 问 根 结 点 类 
/# 中 序 遍历 根 结 点 的 右 子 树 拟 
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PostOrder (root->lchild); 旋 后 序 遍 历 根 结 点 的 左 子 树 */ 
PostOrder(root->rchild); 人 # 后 序 遍 历 根 结 点 的 右 子 树 所 
Printf("%d", root->data); 放 访 问 根 结 点 */ 
jxifwy 
}/*PostOrder*/ 


从 根 结 点 出 发 ，3 种 方法 的 遍历 路 线 如 图 3-21 所 示 。 该 路 线 从 根 结 点 出 发 ， 逆 时 针 沿 着 二 
又 树 的 外 缘 移动 ， 对 每 个 结 点 均 途 经 三 次 。 若 第 一 次 经 过 结 点 时 进行 访问 ， 则 是 先 序 遍历 ， 若 
第 二 次 〈 或 第 三 次 ) 经 过 结 点 时 访问 结 点 ， 则 是 中 序 遍历 〈 或 后 序 遍 历 )。 因 此 ， 只 要 将 遍历 
路 线 上 所 有 在 第 一 次 、 第 二 次 和 第 三 次 经 过 的 结 点 信息 分 别 输出 ， 即 可 分 别 得 到 该 二 又 树 的 先 
序 、 中 序 和 后 序 遍历 序列 。 所 以 ， 若 去 掉 3 种 遍历 算法 中 的 打印 输出 语句 ， 则 3 种 遍历 方法 相 
同 。 这 说 明 3 种 遍历 过 程 的 路 线 相 同 。 


个 a ~ ~ RC 
0 @ © 


图 3-21 3 种 遍历 过 程 执行 示意 图 


遍历 二 又 树 的 基本 操作 就 是 访问 结 点 ， 不 论 按照 哪 种 次 序 遍 历 ， 对 于 含有 了 个 结 点 的 二 又 
树 ， 遍 历 算法 的 时 间 复 杂 度 都 为 O0D)。 因 为 在 遍历 的 过 程 中 ， 每 进行 一 次 递归 调用 ， 都 是 将 函 
数 的 “活动 记录 ” 压 入 栈 中 ， 因 此 ， 栈 的 最 大 长 度 恰 为 树 的 高 度 。 所 以 ， 在 最 坏 情况 下 ， 二 又 
树 是 有 个 结 点 且 高 度 为 了 的 单 枝 树 ， 遍 历 算法 的 空间 复杂 度 也 为 O(n)。 

借助 于 一 个 栈 ， 可 将 二 又 树 的 递归 遍历 算法 转换 为 非 递归 算法 。 下 面 给 出 中 序 遍 历 的 非 递 
归 算 法 。 

【函数 】 二 又 树 的 中 序 非 递归 遍历 算法 。 

int InOrderTraverse(BiTree root) 人 # 二 又 树 的 非 递归 中 序 遍历 算法 类 
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{ BiTreep; 
JnitStack(Sb; 
p=root; 
while (p (= NULL | !isEmpty(St)) { 
if(p!= NULL) 
{ 
Push(St, p); 
p=p->lchild: 
3 
else { 
q= Top(St); Pop(St); 
printf("%d", q->data); 
p= q->rchild; 
MW/*if*/ 
Y/*while*/ 
}/*InOrderTraverse*/ 


遍历 二 叉 树 的 过 程 实质 上 是 按 一 定 的 规则 将 树 中 的 结 点 排 成 一 个 线性 序列 的 过 程 ,因此 遍 
历 操作 得 到 的 是 树 中 结 点 的 一 个 线性 序列 。 在 每 一 种 序列 中 ， 有 且 仅 有 一 个 起 始点 和 一 个 终结 
点 ， 其 余 结 点 有 且 仅 有 唯一 的 直接 前 驱 和 直接 后 继 。 显 然 ， 关 于 结 点 的 前 驱 和 后 继 的 讨论 是 针 


对 某 一 个 遍历 序列 而 言 的 。 


对 二 又 树 还 可 以 进行 层 序 遍历 。 设 二 又 树 的 根 结 点 所 在 的 层 数 为 1， 层 序 遍 历 就 是 从 树 的 
， 然 后 从 左 到 右 依次 访问 第 二 层 上 的 结 点 ， 其 次 是 第 
点 ， 依 此 类 推 ， 自 上 而 下 、 自 左 至 右 逐 层 访问 树 中 各 结 点 的 过 程 就 是 层 序 遍 历 。 


根 结 点 出 发 ， 首 先 访问 第 一 层 的 树 根 结 点 


三 层 上 的 结 
【算法 】 二 又 树 的 层 序 遍历 算法 。 


void LevelOrder(BiTree root) 
{ BiTreep; 
InitQueue(Q); 
EnQueue(Q, root) 
while (lisEmpty(Q)) { 
DeQueue(Q, p); 
Printf("%d", p->data); 


}/*while*/ 
}/*LevelOrder*/ 


启 创 建 一 个 空 栈 */ 
诺 p 指向 树 根 结 点 */ 


让 不 是 空 树 */ 
人 # 根 结 点 指针 入 栈 所 
/# 进 入 根 的 左 子 树 #/ 


放 栈 项 元 素 出 栈 */ 
人 # 访 问 根 结 点 状 
启 进 入 根 的 右 子 树 */ 


让 二 叉 树 的 层 序 遍 历 算法 */ 


旋 创 建 一 个 空 队列 */ 
证 将 根 指针 加 入 队列 */ 
话 队 列 不 空 */ 

作 队 头 元 素 出 队 ， 并 使 p 取 队 头 元 素 的 值 */ 
谍 访 问 结 点 */ 
if (p->lchild) EnQueue(p->lchild); 
if(p->rchild) EnQueue(p->rchild): 
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3.3.4 线索 二 叉 树 
1. 线索 二 又 树 的 定义 


二 叉 树 的 遍历 实质 上 是 对 一 个 非 线 性 结构 进行 线性 化 的 过 程 ， 它 使 得 每 个 结 点 《〈 除 第 一 个 
和 最 后 一 个 ) 在 这 些 线性 序列 中 有 且 仅 有 一 个 直接 前 驱 和 直接 后 继 。 但 在 二 又 链表 存储 结构 中 ， 
只 能 找到 一 个 结 点 的 左 、 右 孩子 ， 不 能 直接 得 到 结 点 在 任 一 遍历 序列 中 的 前 驱 和 后 继 ， 这 些 信 
息 只 有 在 遍历 的 动态 过 程 中 才能 得 到 , 因此 , 引入 线索 二 又 树 来 保存 这 些 动态 过 程 得 到 的 信息 。 


2， 建立 线索 二 又 树 


为 了 保存 结 点 在 任 一 序列 中 的 前 驱 和 后 继 信息 ， 可 以 考虑 在 每 个 结 点 中 增加 两 个 指针 域 来 
存放 遍历 时 得 到 的 前 驱 和 后 继 信息 ， 这 样 就 可 以 为 以 后 的 访问 带 来 方便 。 但 增加 指针 信息 会 降 
低 存储 空间 的 利用 率 ， 因 此 可 考虑 采用 其 他 方法 。 

若 7 个 结 点 的 二 又 树 采 用 二 又 链表 做 存储 结构 ， 则 链表 中 必然 有 n+1 个 室 指 针 域 ， 可 以 利 
用 这 些 空 指针 域 来 存放 结 点 的 前 驱 和 后 继 信息 。 为 此 ， 需 要 在 结 点 中 增加 标志 ltag 和 rtag， 以 
区 分 孩子 指针 的 指向 ， 如 下 所 示 。 


[ tag | hd | da | rehid | rag | 


其 中 : 
0 “lchild 域 指示 结 点 的 左 孩 子 
ltag = 


1 “lchild 域 指示 结 点 的 直接 前 驱 
0 “rchild 域 指示 结 点 的 右 孩 子 
rtag = 


1 “rchild 域 指示 结 点 的 直接 后 继 


若 二 又 树 的 二 又 链表 采用 以 上 所 示 的 结 点 结构 ， 则 相应 的 链表 称 为 线索 链表 ， 其 中 指向 结 
点 前 驱 、 后 继 的 指针 称 为 线索 。 加 上 线索 的 二 又 树 称 为 线索 二 又 树 。 对 二 又 树 以 某 种 次 序 遍历 
使 其 成 为 线索 二 又 树 的 过 程 称 为 线索 化 。 中 序 线索 二 又 树 及 其 存储 结构 如 图 3-22 所 示 。 

那么 如 何 进行 线索 化 呢 ? 按 某 种 次 序 将 二 叉 树 线索 化 , 实质 上 是 在 遍历 过 程 中 用 线索 取代 
空 指针 。 因 此 ， 若 设 指针 p 指向 正在 访问 的 结 点 ， 则 遍历 时 设立 一 个 指针 pre， 使 其 始终 指向 
刚刚 访问 过 的 结 点 〈 即 p 所 示 结 点 的 前 驱 结 点 )， 这 样 就 记 下 了 遍历 过 程 中 结 点 被 访问 的 先后 
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NULL 
人 


(a) 中 序 线索 二 又 树 (b) 中 序 线索 链表 
图 3-22 ”线索 二 又 树 及 其 存储 结构 示意 图 


在 遍历 的 过 程 中 ， 设 指针 p 指向 正在 访问 的 结 点 。 

(1) 若 p 所 指向 的 结 点 有 空 指针 域 ， 则 将 相应 的 标志 域 置 为 1。 

(2) 若 pre!=NULL 且 pre 所 指 结 点 的 rtag 等 于 1， 则 令 pre->rchild=p。 

(3) 若 p 所 指向 结 点 的 ltag 等 于 1， 则 令 p->lchild=pre。 

(4) 使 pre 指向 刚刚 访问 过 的 结 点 ， 即 令 pre=p。 

需要 说 明 的 是 ， 用 这 种 方法 得 到 的 线索 二 叉 树 ， 其 线索 并 不 完整 。 也 就 是 说 ， 部 分 结 点 的 
前 驱 或 后 继 信息 还 需要 通过 进一步 的 运算 来 得 到 。 

3， 访问 线索 二 又 树 


如 何在 线索 二 又 树 中 查找 结 点 的 前 驱 和 后 继 呢 ? 

以 中 序 线索 二 又 树 为 例 ， 令 p 指向 树 中 的 某 个 结 点 ， 查 找 p 所 指 结 点 的 后 继 结 点 的 方法 如 
下 所 述 。 

(1) 若 p->rtag 一 1， 则 p->rchild 即 指向 其 后 继 结 点 。 

(2) 若 p->rtag 一 0， 则 p 所 指 结 点 的 中 序 后 继 必然 是 其 右 子 树 中 进行 中 序 遍 历 得 到 的 第 一 
个 结 点 。 也 就 是 说 ， 从 pp 所 指 结 点 的 右 子 树 的 根 结 点 出 发 ， 沿 左 孩 子 指针 链 向 下 查找 ， 直 到 找 
到 一 个 没有 左 孩 子 的 结 点 时 为 止 ， 这 个 结 点 就 是 p 所 指 结 点 的 直接 后 继 结 点 ， 也 称 其 为 p 的 右 
子 树 中 “最 左下 ”的 结 点 。 


3.3.5 最 优 一 又 树 
1. 最 优 二 又 树 
最 优 二 又 树 又 称 为 哈 夫 曼 树 ， 它 是 一 类 带 权 路 径 长 度 最 短 的 树 。 路 径 是 从 树 中 一 个 结 点 到 
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另 一 个 结 点 之 间 的 通路 ， 路 径 上 的 分 支 数目 称 为 路 径 长 度 。 

树 的 路 径 长 度 是 从 树 根 到 每 一 个 叶子 之 间 的 路 径 长 度 之 和 。 结 点 的 带 权 路 径 长 度 为 从 该 结 
点 到 树 根 之 间 的 路 径 长 度 与 该 结 点 权 值 的 乘积 。 

树 的 带 权 路 径 长 度 为 树 中 所 有 叶子 结 点 的 带 权 路 径 长 度 之 和 ， 记 为 


WPL = WA 
El 


其 中 ,1 为 带 权 时 子 结 点 数目 ，w* 为 叶子 结 点 的 权 值 ， 大 为 叶子 结 点 到 根 的 路 径 长 度 。 
哈 夫 曼 树 是 指 权 值 为 wapz…:wa 的 于 个 叶子 结 点 的 二 叉 树 中 带 权 路 径 长 度 最 小 的 二 又 树 。 
例如 ， 图 3-23 所 示 的 具有 4 个 叶子 结 点 的 二 又 树 ， 其 中 以 图 3-23 (b》 所 示 的 二 叉 树 带 权 
路 径 长 度 最 小 。 


(a) WPL=2x(2+4+5+7)=36 (b) WPL=3x6+10+7=35 (c) WPL=9x3+14+2=43 


图 3-23 不 同 带 权 路 径 长 度 的 二 叉 树 


那么 如 何 构造 最 优 二 又 树 呢 ? 构造 最 优 二 又 树 的 哈 夫 曼 算法 如 下 。 

(1) 根据 给 定 的 n 个 权 值 {wiwwv2…,was}， 构 成 n 棵 二 又 树 的 集合 f= {17T.7D…, 冯 }， 其 中 ， 
每 棵 树 五 中 只 有 一 个 带 权 为 Ww 的 根 结 点 ， 其 左 、 右 子 树 均 空 。 

(2) 在 五 中 选取 两 棵 权 值 最 小 的 树 作为 左 、 右 子 树 构造 一 棵 新 的 二 叉 树 ， 置 新 构造 二 又 树 
的 根 结 点 的 权 值 为 其 左 、 右 子 树 根 结 点 的 权 值 之 和 。 

(3) 从 五 中 删除 这 两 棵 树 ， 同 时 将 新 得 到 的 二 叉 树 加 入 到 天 中 。 
重复 (2)、(3) 步 ， 直 到 五 中 只 含 一 棵 树 时 为 止 ， 这 棵 树 便 是 最 优 二 又 树 哈 夫 曼 树 )。 

由 此 算法 可 知 ， 以 选中 的 两 棵 子 树 构成 新 的 二 叉 树 ， 哪 个 作为 左 子 树 ， 哪 个 作为 右 子 树 ， 
并 没有 明确 。 所 以 ， 具 有 7 个 叶子 结 点 的 权 值 为 wiw2,…,w 的 最 优 二 又 树 不 唯一 ， 但 其 WPL 
值 是 唯一 确定 的 。 

当 给 定 了 个 权 值 后 ， 构 造 出 的 最 优 二 又 树 中 的 结 点 数目 m 就 确定 了 ， 即 m=2Xn-1， 所 
以 可 用 一 维 的 结构 数组 来 存储 最 优 二 又 树 ， 下 面 举例 说 明 。 
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#define MAXLEAFNUM 50  /* 最 优 二 又 树 中 的 最 多 叶子 数目 */ 


typedef struct node{ 

char ch; 人 # 结 点 表示 的 字符 ， 对 于 非 叶子 结 点 ， 此 域 不 用 并 

int weight; 刻 结 点 的 权 值 */ 

int parent; 人 # 结 点 的 父 结 点 的 下 标 ， 为 0 时 表示 无 父 结 点 */ 

int lchild,rchild; 人 # 结 点 的 左 、 右 孩子 结 点 的 下 标 ， 为 0 时 表示 无 孩子 结 点 */ 
}HuffmanTree[2*MAXLEAFNUMI]; 


typedef char* HuffmanCode[MAXLEAFNUMT+1]; 
【函数 】 创 建 最 优 二 又 树 。 


void createHTree(HuffmanTree HT, char *c, int *w, int n) 
必 数 组 c[0.n-1] 和 w[0..n-1] 存 放 了 nn 个 字符 及 其 概率 ， 构 造 哈 夫 曼 树 HT*/ 
{ int i,s1,s2; 
if (n <= 1) return; 
for(i=1; i<=n; it+) { 人 * 根 据 个 权 值 构造 棵 只 有 根 结 点 的 二 叉 树 */ 
HT[il.ch=c[i-1]; HT[il].weight= w{i-1]; 
HTli].parent=HT[i].lchild=HT[i].rchild=0:; 
} 
for(; i<2*n; ++i) {人 * 初 始 化 */ 
HT[li].parent=0; HID].lchild=0: HT[i].rchild=0; 
; 
fori =n+l; i<2*n; i++) { 
刻 从 HT[1..i-1] 中 选择 parent 为 0 且 weight 最 小 的 两 棵 树 ， 其 序号 为 sl 和 s2*/ 
select(HT, i-1, s1, s2); 


HT[s1].parent =i; HT[s2].parent =i: 
HT[il.lchild = s1; HTlil.rchild = s2: 
HT[i].weight = HT[s1].weight + HT[s2].weight: 
}/*for*/ 
}/* createHTree */ 
2. 哈 夫 曼 编码 


若 对 每 个 字符 编制 相同 长 度 的 二 进 制 码 ， 则 称 为 等 长 编码 。 例 如 ， 英 文字 符 集中 的 26 个 
字符 可 采用 5 位 二 进 制 位 串 表示 ， 按 等 长 编码 格式 构造 一 个 字符 编码 表 。 发 送 方 按照 编码 表 对 
信息 原文 进行 编码 后 送出 电文 ， 接 收 方 对 接收 到 的 二 进 制 代码 按 每 5 位 一 组 进行 分 割 ， 通 过 查 
字符 的 编码 表 即 可 得 到 对 应 字符 ， 实 现 译 码 。 

等 长 编码 方案 的 实现 方法 比较 简单 , 但 对 通信 中 的 原文 进行 编码 后 , 所 得 电文 的 码 串 过 长 ， 


第 3 章 数据 结构 “图 129 荐 


不 利于 提高 通信 效率 ， 因 此 希望 缩短 码 串 的 总 长 度 。 如 果 对 每 个 字符 设计 长 度 不 等 的 编码 ， 且 
让 电文 中 出 现 次 数 较 多 的 字符 采用 尽 可 能 短 的 编码 ， 那 么 传送 的 电文 码 串 总 长 度 则 可 减少 。 

如 果 要 设计 长 度 不 等 的 编码 ， 必 须 满足 下 面 的 条 件 : 任 一 字符 的 编码 都 不 是 另 一 个 字符 的 
编码 的 前 级 ， 这 种 编码 也 称 为 前 级 码 。 对 给 定 的 字符 集 D={q1,q;,…,dw} 及 字符 的 使 用 频率 
{wimw2,…,wn}， 构 造 其 最 优 前 级 码 的 方法 为 :以 dd 作为 叶子 结 点 ，wiww2…,w 作为 
叶子 结 点 的 权 值 ， 构 造 出 一 棵 最 优 二 又 树 ， 然 后 将 树 中 每 个 结 点 的 左 分 支 标 上 0， 右 分 支 标 上 
1， 则 每 个 叶子 结 点 代表 的 字符 的 编码 就 是 从 根 到 叶子 的 路 径 上 的 0、1 组 成 的 串 。 

例如 ， 设 有 字符 集 {a,b,c,q,e} 及 对 应 的 权 值 集合 {0.30,0.25,0.15,0.22,0.08}， 按 照 构 造 最 优 二 
又 树 的 哈 夫 曼 方 法 : 先 取 字 符 c 和 所 对 应 的 结 点 构造 一 棵 二 叉 树 ( 根 结 点 的 权 值 为 < 和 的 
权 值 之 和 ), 然后 与 4 对 应 的 结 点 分 别 作 为 左 、 右 子 树 构 
造 二 叉 树 ， 之 后 选 a 和 b 所 对 应 的 结 点 作为 左 、 右 子 树 
构造 二 又 树 ， 最 后 得 到 的 最 优 二 又 树 〈 哈 夫 曼 树 ) 如 图 
3-24 所 示 。 其 中 ， 字 符 a 的 编码 为 00， 字 符 b、c、d、e 
的 编码 分 别 为 01、100、11、101。 

译 码 时 就 从 树 根 开始 , 若 编 码 序列 中 当前 编码 为 0， 
则 进入 当前 结 点 的 左 子 树 ; 为 1 则 进入 右 子 树 ， 到 达 叶 
子 时 一 个 字符 就 翻译 出 来 了 ， 然 后 再 从 树 根 开始 重复 上 
述 过 程 ， 直 到 编码 序列 结束 。 例 如 ， 若 编码 序列 
101110000100 对 应 的 字符 编码 采用 图 3-24 所 示 的 树 进 
行 构造 ， 则 可 翻译 出 字符 序列 "edaac"。 

【函数 】 根 据 给 定 的 哈 夫 曼 树 ， 从 每 个 叶子 结 点 出 发 追溯 到 树 根 ， 逆 向 找 出 最 优 二 又 树 中 
叶子 结 点 的 编码 。 

void HuffmanCoding(HuffmanTree HT,HuffmanCode HC.intn) 

/*n 个 叶子 结 点 在 哈 夫 曼 树 HT 中 的 下 标 为 1~n， 第 il <is< mn) 个 叶子 的 编码 存放 HC[] 中 志 

{ char*cd; inti start,c,£ 

下 <= 1) retum; 
cd= (char *)malloc(n*sizeof(char)); cdfln-1] ="0'; 
fori=1;i<=n;it+) { 
start = n—l1; 
for(c =1f= HT[il].parent:f != 0:c =£f= HT[f].parent) 
if (HT[f.lchild 一 e) cd[--start]="'0'; 


图 3-24 ”前 级 编码 示例 
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else cd[--start] ="1'; 
HC[i] = (char *)malloc((n-start)*sizeof(char)): 
strepy(HC[i],&cd[start]); 
Ha*for*/ 
free(cd); 
}y/*HuffmanCoding*/ 
利用 哈 夫 曼 树 译 码 的 过 程 为 : 从 根 结 点 出 发 ， 按 二 进 制 位 串 中 的 0 和 1 确定 是 进入 左 分 支 
还 是 右 分 支 ， 当 到 达 叶 子 结 点 时 译 出 一 个 字符 。 若 位 串 未 结束 ， 则 回 到 根 结 点 继续 上 述 译 码 过 
程 ， 直 到 位 串 结束 。 
【函数 】 用 最 优 二 又 树 进行 译 码 。 
void Decoding(HuffmanTree HT, int n, char *buff) 
人 # 利 用 具有 了 个 叶子 结 点 的 最 优 二 叉 树 〈 存 储 在 数组 HT 中 ) 进行 译 码 ， 叶 子 的 下 标 为 1~n*/ 
/#bu 任 指向 二 进 制 位 串 编码 序列 类 
{ intp=2*n-l; 


while (*buff) { 
让 ((*bufp 一 '0) p=HT[pl.lchild; 人 # 进 入 左 分 支 检 
elsep= HT[p].rchild: 话 进 入 右 分 支 */ 


if (HT[p].lchild==0 && HT[p].rehild—0){ 上 访 到 达 一 个 叶子 结 点 *#/ 
printf("%e", HT[p].ch); 
p=2*n-1; 上 刻 回 到 树 根 */ 
Jifw/ 
bufft++; 
}/*while*/ 
}/*Decoding*/ 


3.3.6 ” 树 和 和 森林 

1. 树 的 存储 结构 

常用 的 树 的 存储 有 双亲 表示 法 、 孩 子 表示 法 和 孩子 兄弟 表示 法 。 

(1) 树 的 双亲 表示 法 。 该 表示 法 用 一 组 地 址 连续 的 单元 存储 树 的 结 点 ， 并 在 每 个 结 点 中 附 
设 一 个 指示 器 ， 指 出 其 双亲 结 点 在 该 存储 结构 中 的 位 置 〈 即 结 点 所 在 数组 元 素 的 下 标 )。 显 然 ， 


这 种 表示 法 对 于 求 指 定 结 点 的 双亲 和 祖先 都 十 分 方便 ， 但 对 于 求 指定 结 点 的 孩子 及 后 代 则 需要 
遍历 整个 数组 ， 树 的 双亲 表示 法 如 图 3-25 所 示 。 
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结 点 
序列 数据 双亲 
0 
QD 
(©) © (9) 
@ 
(a) 树 (b) 树 的 双亲 表示 


图 3-25 树 的 双亲 表示 法 示意 图 


(2) 树 的 孩子 表示 法 。 该 表示 法 在 存储 结构 中 用 指针 指示 出 结 点 的 每 个 孩子 ， 为 树 中 每 个 
结 点 的 孩子 建立 一 个 链表 ， 即 令 每 个 结 点 的 所 有 孩子 结 点 构成 一 个 用 单 链表 表示 的 线性 表 ， 则 
n 个 结 点 的 树 具 有 n 个 单 链表 。 将 这 n 个 单 链表 的 头 指 针 又 排 成 一 个 线性 表 ， 如 图 3-26 (a) 所 
示 。 显 然 ， 树 的 孩子 表示 法 便于 查找 每 个 结 点 的 子孙 ， 若 要 找 出 指定 结 点 的 双亲 则 可 能 需要 遍 
历 所 有 的 链表 。 


(a) 树 的 孩子 表示 (b) 树 的 双亲 孩子 表示 
图 3-26 图 3-25 (a) 中 树 的 孩子 表示 法 


用 户 也 可 以 将 双亲 表示 法 和 孩子 表示 法 结合 起 来 ， 形 成 树 的 双亲 孩子 表示 结构 ， 如 图 3-26 
(b) 所 示 。 

(3) 孩子 兄弟 表示 法 ， 孩 子 兄 弟 表 示 法 又 称 为 二 又 链表 表示 法 ， 它 在 链表 的 结 点 中 设置 两 
个 指针 域 分 别 指向 该 结 点 的 第 一 个 孩子 和 下 一 个 兄弟 ， 如 图 3-27 所 示 。 

树 的 孩子 兄弟 表示 法 为 实现 树 、 森 林 与 二 又 树 之 间 的 转换 提供 了 可 能 ， 充 分 利用 二 又 树 的 
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有 关 算 法 来 实现 树 及 森林 的 操作 ， 对 难以 把 握 规 律 的 树 和 森林 有 
着 重要 的 现实 意义 。 CD 


2. 树 和 森林 的 遍历 QH—) 
1) 树 的 遍历 (人 GA 


由 于 树 中 的 每 个 结 点 可 以 有 多 个 子 树 ， 因 此 遍历 树 的 方法 有 四 
两 种 ， 即 先 根 遍历 和 后 根 遍 历 。 

(1) 树 的 先 根 遍历 。 树 的 先 根 遍历 是 先 访问 树 的 根 结 点 ,， 然 ”图 3-27 图 3-25 (a) 中 树 
后 依次 先 根 人 遍历 根 的 各 棵 子 树 。 对 树 的 先 根 人 遍历 等 同 于 对 转换 所 的 孩子 兄弟 表示 法 
得 的 二 又 树 进行 先 序 遍历 。 

(2) 树 的 后 根 遍 历 。 树 的 后 根 遍 历 是 先 依次 后 根 遍 历 树 根 的 各 棵 子 树 , 然后 访问 树 根 结 点 。 
树 的 后 根 遍 历 等 同 于 对 转换 所 得 的 二 又 树 进行 中 序 遍 历 。 

2) 森林 的 遍历 

按照 森林 和 树 的 相互 递归 定义 ， 可 以 得 出 森林 的 两 种 遍历 方法 。 

(1) 先 序 遍历 森林 。 若 森林 非 空 ， 首 先 访问 森林 中 第 一 棵 树 的 根 结 点 ， 然 后 先 序 遍历 第 一 
棵 树 根 结 点 的 子 树 森 林 ， 最 后 先 序 遍 历 除 第 一 棵 树 之 外 剩余 的 树 所 构成 的 森林 。 

(2) 中 序 遍 历 森林 。 若 森林 非 空 ， 首 先 中 序 遍 历 森 林 中 第 一 棵 树 的 子 树 森 林 ， 然 后 访问 第 
一 棵 树 的 根 结 点 ， 最 后 中 序 遍 历 除 第 一 棵 树 之 外 剩余 的 树 所 构成 的 森林 。 


3. 树 、 森 林 和 二 又 树 之 间 的 相互 转换 


树 、 森 林 和 二 叉 树 之 间 可 以 互相 进行 转换 ， 即 任何 一 个 森林 或 一 棵 树 可 以 对 应 表示 为 一 棵 
二 义 树 ， 而 任何 一 棵 二 叉 树 也 能 对 应 到 一 个 森林 或 一 棵 树 上 。 

(1) 树 、 森 林 转 换 为 二 叉 树 。 利 用 树 的 孩子 兄弟 表示 法 可 导出 树 与 二 叉 树 的 对 应 关系 ， 在 
树 的 孩子 兄弟 表示 法 中 ， 从 物理 结构 上 看 与 二 又 树 的 二 又 链表 表示 法 相同 ， 因 此 就 可 以 用 这 种 
同一 存储 结构 的 不 同 解释 将 一 棵 树 转换 为 一 棵 二 又 树 ， 如 图 3-28 所 示 。 一 棵 树 可 转换 成 唯一 的 


一 棵 二 又 树 。 
(9 () 
2 一 9 
I HO @ ©) 
(人 


图 3-28 ” 树 转换 为 二 叉 树 
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由 于 树 根 没有 兄弟 ， 所 以 树 转换 为 二 叉 树 后 ， 二 叉 树 的 根 一 定 没 有 右 子 树 。 这 样 ， 将 一 个 
森林 转换 为 一 棵 二 叉 树 的 方法 是 : 先 将 森林 中 的 每 一 棵 树 转换 为 二 又 树 ， 再 将 第 一 棵 树 的 根 作 
为 转换 后 的 二 叉 树 的 根 ， 第 一 棵 树 的 左 子 树 作为 转换 后 二 叉 树 根 的 左 子 树 ， 第 二 棵 树 作为 转换 
后 二 叉 树 的 右 子 树 ， 第 三 棵 树 作为 转换 后 二 叉 树 根 的 右 子 树 的 右 子 树 ， 依 此 类 推 ， 森 林 就 可 以 
转换 为 一 棵 二 叉 树 ， 如 图 3-29 所 示 。 


Q 
J 
GB) (3) 
@ 
图 3-29 ”森林 转换 为 二 又 树 


(2) 二 又 树 转换 为 树 和 森林 。 一 棵 二 又 树 可 转换 为 唯一 的 树 或 森林 ， 如 图 3-30 所 示 。 


图 3-30 二 又 树 转换 为 树 〈 或 森林 ) 


3 进 


图 是 比 树 结构 更 复杂 的 一 种 数据 结构 。 在 线性 结构 中 ， 除 首 结 点 没有 前 驱 、 末 尾 结 点 没有 
后 继 外 ， 一 个 结 点 只 有 唯一 的 一 个 直接 前 驱 和 唯一 的 一 个 直接 后 继 。 在 树 结构 中 ， 除 根 结 点 没 
有 前 驱 结 点 外 ， 其 余 的 每 个 结 点 只 有 唯一 的 一 个 前 驱 〈 双 亲 ) 结 点 和 多 个 后 继 〈 子 树 ) 结 点 。 
而 在 图 中 ， 任 意 两 个 结 点 之 间 都 可 能 有 直接 的 关系 ， 所 以 图 中 一 个 结 点 的 前 驱 结 点 和 后 继 结 点 
的 数目 是 没有 限制 的 。 
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3.4.1 图 的 定义 与 存储 
1. 图 的 定义 


图 G 是 由 集合 矿 和 下 构成 的 二 元 组 , 记 作 G=( 信 妃 , 其 中 , 及 是 图 中 项 点 的 非 空 有 限 集合 ， 
巨 是 图 中 边 的 有 限 集合 。 从 数据 结构 的 逻辑 关系 角度 来 看 ， 图 中 任 一 项 点 都 有 可 能 与 其 他 顶点 
有 关系 ， 而 图 中 所 有 项 点 都 有 可 能 与 某 一 顶点 有 关系 。 在 图 中 ， 数 据 元 素 用 项 点 表示 ， 数 据 元 
素 之 间 的 关系 用 边 表示 。 

(1) 有 向 图 。 若 图 中 每 条 边 都 是 有 方向 的 ， 那 么 顶点 之 间 的 关系 用 <wv> 表 示 ， 它 说 明 从 
到 沪 有 一 条 有 向 边 (也 称 为 弧 )。vw 是 有 向 边 的 起 点 ， 称 为 弧 尾 ; 是 有 向 边 的 终点 ， 称 为 弧 
头 。 所 有 边 都 有 方向 的 图 称 为 有 向 图 。 

(2) 无 向 图 。 车 图 中 的 每 条 边 都 是 无 方向 的 ,顶点 名和 久之 间 的 边 用 (w，) 表示 。 因 此 ， 
在 有 向 图 中 <vev> 与 <vv> 分 别 表示 两 条 边 ， 而 在 无 向 图 中 (ww) 与 wy，w) 表示 的 是 同一 
条 边 。 

(3) 完全 图 。 若 一 个 无 向 图 具有 个 项 点 ， 而 每 一 个 项 点 与 其 他 n-1 个 顶点 之 间 都 有 边 ， 
则 称 之 为 无 向 完全 图 。 显 然 ， 含 有 个 项 点 的 无 向 完全 图 共有 下 一 条 边 。 类 似 地 ， 有 个 


顶点 的 有 向 完全 图 中 弧 的 数目 为 n(n-]), 即 任意 两 个 不 同 项 点 之 间 都 有 方向 相反 的 两 条 弧 存 在 。 
(4) 度 、 出 度 和 入 度 。 顶 点 v 的 度 是 指 关 联 于 该 项 点 的 边 的 数目 ， 记 作 D(v)。 若 G 为 有 向 

图 ， 顶 点 的 度 表示 该 顶点 的 入 度 和 出 度 之 和 。 顶 点 的 入 度 是 以 该 顶点 为 终点 的 有 向 边 的 数目 ， 

而 顶点 的 出 度 指 以 该 顶点 为 起 点 的 有 向 边 的 数目 ,分别 记 为 IP() 和 OD(v)。 无 论 是 有 向 图 还 是 


e -这 pe 


(5) 路 径 。 在 无 向 图 G 中 ， 从 顶点 区 到 顶点 vo 的 路 径 是 指 存在 一 个 顶点 序列 Vp，wva， 
Vizs ,Vins Vg 使 得 (Vp, Va), (Vas Vz), **, (Vn Vg) 均 属 于 E(G)。 若 G 是 有 向 图 ， 其 
路 径 也 是 有 方向 的 , 它 由 E(G) 中 的 有 向 边 <ypwvin>,<vasvp>,…,<vinve> 组 成 。 路径 长 度 是 路 径 上 边 
或 弧 的 数目 。 第 一 个 顶点 和 最 后 一 个 顶点 相同 的 路 径 称 为 回路 或 环 。 若 一 条 路 径 上 除了 和 vo 
可 以 相同 外 ， 其 余 项 点 均 不 相同 ， 则 称 其 为 简单 路 径 。 

(6) 子 图 。 若 有 两 个 图 G=(V,E) 和 G'=(V',E”)， 如果 VcV 且 E'cE， 则 称 G' 为 G 的 
子 图 。 

(7) 连通 图 与 连通 分 量 。 在 无 向 图 G 中 ， 若 从 顶点 六 到 顶点 ww 有 路 径 ， 则 称 顶 点 vi 和 项 
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点 疙 是 连通 的 。 如 果 无 向 图 G 中 任意 两 个 顶点 都 是 连通 的 ， 则 称 其 为 连通 图 。 无 向 图 G 的 极 
大 连通 子 图 称 为 G 的 连通 分 量 。 

(8) 强 连通 图 与 强 连 通 分 量 。 在 有 向 图 G 中 ， 如 果 对 于 每 一 对 顶点 vi, VeV 且 vz#v; 
从 顶点 六 到 顶点 六 和 从 顶点 六 到 顶点 六 都 存在 路 径 ， 则 称 图 G 为 强 连通 图 。 有 向 图 中 的 极 
大 连通 子 图 称 为 有 向 图 的 强 连通 分 量 。 

(9) 网 。 边 (或 弧 ) 带 权 值 的 图 称 为 网 。 

(10) 有 向 树 。 如 果 一 个 有 向 图 惟有 一 个 项 点 的 入 度 为 0， 其 余 顶 点 的 入 度 均 为 1， 则 是 一 
棵 有 向 树 。 

从 图 的 逻辑 结构 的 定义 来 看 ， 图 中 的 项 点 之 间 不 存在 全 序 关系 ( 即 无 法 将 图 中 的 项 点 排列 
成 一 个 线性 序列 )， 任 何 一 个 项 点 都 可 被 看 成 第 一 个 项 点 ， 另 一 方面 ， 任 一 项 点 的 邻接 点 之 间 
也 不 存在 次 序 关 系 。 为 了 便于 运算 ， 给 图 中 的 每 个 项 点 赋予 一 个 序号 值 。 

2， 图 的 存储 结构 

图 的 基本 存储 结构 有 邻接 矩阵 表示 法 和 邻接 链表 表示 法 两 种 。 

1) 邻接 矩阵 表示 法 

图 的 邻接 矩阵 表示 法 是 指 用 一 个 矩阵 来 表示 图 中 顶点 之 间 的 关系 。 对 于 具有 7 个 顶点 的 图 
G= (VE)， 其 邻接 矩阵 是 一 个 n 阶 方 阵 ， 且 满足 : 
1 若 (w,vj) 或 <vi,v; > 是 E 中 的 边 
0 若 (w,v)) 或 <vi,vj > 不 是 已 中 的 边 


40] 四 = | 


由 邻接 矩阵 的 定义 可 知 ， 无 向 图 的 邻接 矩阵 是 对 称 的 ， 有 向 图 的 邻接 矩阵 则 不 一 定 对 
称 。 借 助 于 邻接 矩阵 容易 判定 任意 两 个 顶点 之 间 是 否 有 边 〈 或 弧 ) 相连 ， 并 且 容 易 求 得 各 个 项 
点 的 度 。 对 于 无 向 图 ， 顶 点 v 的 度 是 邻接 矩阵 第 i 行 ( 或 列 ) 中 值 不 为 0 的 元 素 个 数 ， 对 于 有 
向 图 ， 第 i 行 ( 或 列 中 值 不 为 0 的 元 素 个 数 是 项 点 vw 的 出 度 OD(w)， 第 j 列 的 非 0 元 素 个 数 
是 顶点 疙 的 入 度 IDQ)。 

网 ( 赋 权 图 ) 的 邻接 矩阵 可 定义 为 : 

am ee 
吕 车 wy) 或 <wv > 不 属于 E 


其 中 ， 鹏 是 边 〈 弧 ) 上 的 权 值 。 
图 3-31 所 示 的 有 向 图 和 无 向 图 的 邻接 矩阵 分 别 为 4 和 B。 
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图 3-31 有 向 图 和 无 向 图 及 其 邻接 矩阵 


图 3-32 所 示 的 是 一 个 网 及 其 邻接 矩阵 C。 


mw 5 % 7 oo 
mm 4 oo om 
站 8 mo oo o 9 
mm 5% 6 
om mo 5 co o 
3 co oo oo 1 ~ 
图 3-32 ”一 个 网 及 其 邻接 矩阵 表示 
若 用 邻接 矩阵 表示 图 ， 则 对 应 的 数据 类 型 可 定义 为 : 
#define MaxN 30 人 # 图 中 顶点 数目 的 最 大 值 专 
typedef int AdjMatrix[MaxN][MaxN]:; 
或 
typedef double AdjMatrix[MaxN][MaxN]; 。“/* 邻 接 矩 阵 */ 
typedef struct { 
int Voum; 访 图 中 的 顶点 数目 */ 
AdjMatrix Arcs; 


}Graph:; 
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2) 邻接 链表 表示 法 

邻接 链表 表示 法 指 的 是 为 图 的 每 个 顶点 建立 一 个 单 链表 ， 第 i 个 单 链表 中 的 结 点 表示 依附 
于 顶点 六 的 边 〈 对 于 有 向 图 是 以 vi 为 尾 的 弧 )。 邻 接 链表 中 的 结 点 有 表 结 点 (或 边 结 点 ) 和 表 
头 结 点 两 种 类 型 ， 如 下 所 示 。 


表 结 点 表 头 结 点 
[adivex T ee | mm | 


其 含义 如 下 。 

。 ”adjvex: 指示 与 顶点 vi 邻接 的 顶点 的 序号 。 

。 ”nextarc: 指示 下 一 条 边 或 弧 的 结 点 。 

。 info: 存储 与 边 或 弧 有 关 的 信息 ， 如 权 值 等 。 

。 data: 存储 顶点 六 的 名 或 其 他 有 关 信 息 。 

。 ”firstarc: 指示 链表 中 的 第 一 个 结 点 (邻接 顶点 )。 

这 些 表 头 结 点 通常 以 顺序 的 形式 存储 ， 以 便 随 机 访问 任 一 顶点 的 邻接 链表 。 若 图 用 邻接 链 
表 来 表示 ， 则 对 应 的 数据 类 型 可 定义 如 下 : 


#define MaxN 50 刻 图 中 项 点 数目 的 最 大 值 */ 
typedef struct ArcNode{ /# 邻 接 链表 的 表 结 点 类 
int adjvex; 证 邻接 顶点 的 项 点 序号 */ 
double weight: 让 边 ( 弧 ) 上 的 权 值 */ 
struct ArcNode *nextarc; 旋 指 向 下 一 个 邻接 顶点 的 指针 */ 
}EdgeNode; 
typedef struct VNode{ 证 邻 接 链 表 的 头 结 点 */ 
char data; /# 顶 点 表示 的 数据 ， 以 一 个 字符 表示 所 
struct ArcNode *firstarc: 上 旋 指 向 第 一 条 依附 于 该 项 点 的 边 或 弧 的 指针 */ 
}AdjList[MaxN]; 
typedef struct { 
int Vnum:; 颇 图 中 项 点 的 数目 */ 
AdiList ”Vertices: 
}Graph; 
显然 , 对 于 有 n 个 顶点 、e 条 边 的 无 向 图 来 说 , 其 邻接 链表 需 用 n 个 头 结 点 和 2e 个 表 结 点 。 
对 于 无 向 图 的 邻接 链表 ,项 点， 的 度 恰 为 第 ; 个 邻接 链表 中 表 结 点 的 数目 ,而 在 有 向 图 中 ， 
为 求 顶 点 的 入 度 ， 必 须 扫描 逐个 邻接 表 ， 这 是 因为 第 i 个 邻接 链表 中 表 结 点 的 数目 只 是 顶点 六 


的 出 度 。 为 此 , 可 以 建立 一 个 有 向 图 的 逆 邻 接 链表 。 有 向 图 的 邻接 表 和 逆 邻 接 表 如 图 3-33 所 示 。 
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十 ~L1L | 二 -=[2TA 人 3 和 
0 | 和 
十 -EX CAI 
十 =~[L0TA] [2T 人 | 
(a) 有 向 图 (b) 邻接 表 (c) 首 邻 接 表 


图 3-33 一 个 有 向 图 及 其 邻接 表 和 逆 邻 接 表 表示 


3.4.2 图 的 遍历 


图 的 遍历 是 指 从 某 个 项 点 出 发 ， 沿 着 某 条 搜索 路 径 对 图 中 的 所 有 项 点 进行 访问 且 只 访问 一 
次 的 过 程 。 图 的 遍历 算法 是 求解 图 的 连通 性 问题 、 拓 扑 排序 及 求 关键 路 径 等 算法 的 基础 。 

图 的 遍历 要 比 树 的 遍历 复杂 得 多 。 因 为 图 的 任 一 个 结 点 都 可 能 与 其 余 顶 点 相 邻接 ， 所 以 在 
访问 了 某 个 项 点 之 后 ， 可 能 沿 着 某 路 径 又 回 到 该 结 点 上 ， 为 了 避免 对 顶点 进行 重复 访问 ， 在 图 


的 遍历 过 程 中 必须 记 下 每 个 已 访问 过 的 顶点。 深度 优先 搜索 和 广度 优先 搜索 是 两 种 遍历 图 的 基 
本 方法 。 


1， 深度 优先 搜索 (Depth First Search，DFS) 


此 种 方法 类 似 于 树 的 先 根 遍历 ,在 第 一 次 经 过 一 个 项 点 时 就 进行 访问 操作 。 从 图 G 中 任 一 
结 点 v 出 发 按 深度 优先 搜索 法 进行 遍历 的 步骤 如 下 。 
(1) 设置 搜索 指针 p， 使 p 指向 顶点 v。 


向 这 个 未 被 访问 的 项 点 ， 然 后 重复 步骤 (2)， 直 到 所 有 的 顶点 均 被 访问 为 止 。 
该 算法 的 特点 是 尽 可 能 先 对 纵深 方向 搜索 ， 因 此 可 以 得 到 其 递归 遍历 算法 。 
【函数 】 以 邻接 链表 表示 图 的 深度 优先 搜索 算法 。 


int visited[MaxN] = {0}: 人 # 调 用 遍历 算法 前 设置 所 有 的 顶点 都 没有 被 访问 过 所 
void Dfs(Graph G int i) { 

EdgeNode *t: int j; 

printf("%d", 2); 访 访 问 序号 为 1 的 顶点 */ 


visited[i] = 1; 刻 序 号 为 i 的 顶点 已 被 访问 过 */ 
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t= GVertices[i].firstarc: /# 取 顶点 i 的 第 一 个 邻接 顶点 类 


while(t != NULL) { /# 检 查 所 有 与 顶点 丰 相 邻接 的 顶点 类 
j=t>adjvex: 上 # 顶 点 j 为 顶点 i 的 一 个 邻接 顶点 */ 
if(visited[j] = 0) /# 若 顶点 j 未 被 访问 则 从 顶点 j 出 发 进行 深度 优先 搜索 */ 
DR(Gj); 
t= t->nextarc; /# 取 顶点 i 的 下 一 个 邻接 顶点 类 
}/*while*/ 
}/*Dfs*/ 


从 函数 Dfs0 之 外 调用 Dfs 可 以 访问 到 所 有 与 起 始 项 点 有 路 径 相通 的 其 他 顶点 。 若 图 是 不 连 
通 的 ， 则 下 一 次 应 从 另 一 个 未 被 访问 过 的 顶点 出 发 ， 再 次 调用 Dfs 进行 遍历 ， 直 到 将 图 中 所 有 
的 顶点 都 访问 到 为 止 。 深 度 优先 的 搜索 过 程 如 图 3-34 所 示 。 

深度 优先 遍历 图 的 过 程 实质 上 是 对 某 个 项 点 查找 其 邻接 点 的 过 程 ， 其 耗费 的 时 间 取 决 于 所 
采用 的 存储 结构 。 当 图 用 邻接 矩阵 表示 时 ， 查 找 所 有 项 点 的 邻接 点 所 需 时 间 为 O(m”)。 若 以 邻 
接 表 作 为 图 的 存储 结构 ， 则 需要 O(e) 的 时 间 复 杂 度 查找 所 有 顶点 的 邻接 点 。 因 此 ， 当 以 邻接 表 
作为 存储 结构 时 ， 深 度 优先 搜索 遍历 图 的 时 间 复 杂 度 为 O(n+e)。 

2， 广度 优先 搜索 (Breadth First Search，BFS) 

图 的 广度 优先 搜索 方法 为 :从 图 中 的 某 个 顶点 v 出 发 ， 在 访问 了 v 之 后 依次 访问 v 的 各 个 
未 被 访问 过 的 邻接 点 ， 然 后 分 别 从 这 些 邻 接点 出 发 依次 访问 它们 的 邻接 点 ， 并 使 “ 先 被 访问 的 
顶点 的 邻接 点 ” 先 于 “后 被 访问 的 顶点 的 邻接 点 ”被 访问 ， 直 到 图 中 所 有 已 被 访问 的 顶点 的 邻 
接点 都 被 访问 到 。 若 此 时 还 有 未 被 访问 的 顶点 ， 则 另 选 图 中 的 一 个 未 被 访问 的 顶点 作为 起 点 ， 
重复 上 述 过 程 ， 直 到 图 中 所 有 的 顶点 都 被 访问 到 为 止 。 对 图 3-35 所 示 的 图 进行 广度 优先 搜索 ， 
得 到 的 序列 为 “1，2，3，4，5，6”。 


NR ©O 
© BO) © 


图 3-34 ”深度 优先 搜索 遍历 过 程 图 3-35 一 个 不 连通 的 无 向 图 


Ee 
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广度 优先 遍历 图 的 特点 是 尽 可 能 先进 行 横向 搜索 ， 即 最 先 访问 的 顶点 的 邻接 点 也 先 被 访 
问 。 为 此 ， 引 入 队列 来 保存 已 访问 过 的 顶点 序列 ， 即 每 当 一 个 顶点 被 访问 后 ， 就 将 其 放 入 队列 


中 ， 当 队 头 项 点 出 队 时 ， 就 访问 其 未 被 访问 的 邻接 点 并 令 这 些 邻 接 顶 点 入 队 。 
【算法 】 以 邻接 链表 表示 图 的 广度 优先 搜索 算法 。 
void Bfs(Graph G) 
{As 广度 优先 遍历 图 G*/ 
EdgeNode *t int 1j,k:; 
int visited[MaxN] = {0}; 诈 调 用 遍历 算法 前 设置 所 有 的 顶点 都 没有 被 访问 过 */ 
InitQueue(Q); 旋 创 建 一 个 空 队 列 */ 
for(i=0; i<GVnum; it+) { 
if (Ilvisited[i]) { 族 顶 点 i 未 被 访问 过 */ 
EnQueue(Q,); 
Printf("%d ",i); visited[i]=1; 族 访 问 顶 点 1 并 设置 已 访问 标志 */ 
while(!isEmpty(Q) { 雍 车 队列 不 空 ， 则 继续 取 顶 点 进行 广度 优先 搜索 */ 
DeQuque(Q.K); 
t= GVertices[k].firstarc; 
for(; t; t= t->nextarc){ 让 检 查 所 有 与 顶点 k 相 邻接 的 顶点 */ 
j=t->adjvex; 记 顶 点 j 是 顶点 k 的 一 个 邻接 顶点 */ 
if (visited[j] = 0) { 族 车 顶点 j 未 被 访问 过 ， 将 j 加 入 队列 */ 
EnQueue(Q, ]); 
Printf("%d ", j); 旋 访 问 序号 为 j 的 项 点 并 设置 已 访问 标志 */ 
visited[j] = 1: 
} mie/ 
}/*for*/ 
}/*while*/ 
jxifw 
}/*for i*/ 
}/*Bfs*/ 
在 广度 优先 遍历 算法 中 ， 每 个 顶点 最 多 进 一 次 队列 。 


遍历 图 的 过 程 实质 上 是 通过 边 或 弧 找 邻接 点 的 过 程 , 因 此 广度 优先 搜索 遍历 图 和 深度 优先 
搜索 遍历 图 的 运算 时 间 复 杂 度 相同 ， 其 不 同 之 处 仅仅 在 于 对 顶点 访问 的 次 序 不 同 。 


3.4.3 ”生成 树 及 最 小 生成 树 
1.， 生 成 树 的 概念 
对 于 有 n 个 顶点 的 连通 图 ， 至 少 有 n-1 条 边 ， 而 生成 树 中 恰好 有 n-1 条 边 ， 所 以 连通 图 的 
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生成 树 是 该 图 的 极 小 连通 子 图 。 若 在 图 的 生成 树 中 任意 加 一 条 边 , 则 必然 形成 回路 。 图 3-36 (a) 
所 示 的 无 向 图 的 一 个 生成 树 如 图 3-36 (b) 所 示 ， 图 3-36 〈c) 不 是 生成 树 ， 因 为 存在 回路 。 


(a) (b) 生成 树 (c) 非 生成 树 
图 3-36 一 个 无 向 图 的 生成 树 和 非 生成 树 
图 的 生成 树 不 是 唯一 的 。 从 不 同 的 顶点 出 发 ， 选 择 不 同 的 存储 方式 ， 用 不 同 的 求解 方法 ， 


可 以 得 到 不 同 的 生成 树 。 对 于 非 连通 图 而 言 ， 每 个 连通 分 量 中 的 顶点 集 和 遍历 时 走 过 的 边 集 一 
起 构成 若干 棵 生成 树 ， 把 它们 称 为 非 连通 图 的 生成 树 森 林 。 按 深度 和 广度 优先 搜索 进行 遍历 将 
得 到 不 同 的 生成 树 ， 分 别称 为 深度 优先 生成 树 和 广度 优先 生成 树 。 例 如 ， 图 3-37 所 示 的 是 图 
3-36 (a) 的 一 棵 深度 优先 生成 树 和 一 棵 广度 优先 生成 树 。 


(a) DFS 生成 树 (b) BFS 生成 树 
图 3-37 图 的 搜索 生成 树 


2. 最 小 生成 树 

对 于 连通 网 来 说 ， 边 是 带 权 值 的 ， 生 成 树 的 各 边 也 带 权 值 ， 因 此 把 生成 树 各 边 的 权 值 总 和 
称 为 生成 树 的 权 ， 把 权 值 最 小 的 生成 树 称 为 最 小 生成 树 。 求 解 最 小 生成 树 有 许多 实际 的 应 用 。 

常用 的 最 小 生成 树 求解 算法 有 普 里 姆 (Prim) 算法 和 克 和 鲁 斯 卡尔 (Kruskal) 算法 。 

(1) 普 里 姆 (Prim) 算法 。 

假设 N=(T, 妃 是 连通 网 ,TE 是 N 上 最 小 生成 树 中 边 的 集合 .算法 从 顶点 集合 [fooj(Coe 中、 
边 的 集合 TE= 人 开始 ， 重复 执行 下 述 操作 : 在 所 有 ue U,ve VU 的 边 (u,v)eE 中 找 一 条 代价 最 
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小 的 边 (wo,vo)， 把 这 条 边 并 入 集合 TE， 同 时 将 vo 并 入 集合 U， 直 到 U=V 时 为 止 。 此 时 TE 中 必 
有 wn-l 条 边 ，7=(V,{TE}) 为 NN 的 最 小 生成 树 。 

由 此 可 知 , 普 里 姆 算法 构造 最 小 生成 树 的 过 程 是 以 一 个 顶点 集合 {uo} 作 为 初 态 , 不 断 寻 
找 与 避 中 顶点 相 邻 且 代 价 最 小 的 边 的 另 一 个 项 点， 扩充 UU 集合 直到 UV 时 为 止 。 

用 普 里 姆 算法 构造 最 小 生成 树 的 过 程 如 图 3-38 所 示 。 


图 3-38 普 里 姆 算法 构造 最 小 生成 树 的 过 程 


普 里 姆 算法 的 时 间 复 杂 度 为 O02, 与 图 中 的 边 数 无 关 , 因此 该 算法 适合 于 求 边 稠 密 的 网 的 
最 小 生成 树 。 

(2) 克 鲁 斯 卡尔 (Kruskal) 算法 。 

克 鲁 斯 卡尔 求 最 小 生成 树 的 算法 思想 为 : 假设 连通 网 N=(V.E)， 令 最 小 生成 树 的 初始 状 
态 为 只 有 7 个 顶点 而 无 边 的 非 连通 图 二 (Vf)， 图 中 每 个 项 点 自 成 一 个 连通 分 量 。 在 E 中 
选择 代价 最 小 的 边 ， 若 该 边 依附 的 顶点 落 在 了 中 不 同 的 连通 分 量 上 ， 则 将 此 边 加 入 到 了 中 ， 否 
则 舍 去 此 边 而 选择 下 一 条 代价 最 小 的 边 。 依 此 类 推 ， 直 到 7 中 所 有 项 点 都 在 同一 连通 分 量 上 
为 止 。 

用 克 鲁 斯 卡尔 算法 构造 图 3-38 〈a) 所 示 网 的 最 小 生成 树 的 过 程 如 图 3-39 所 示 。 

克 鲁 斯 卡尔 算法 的 时 间 复 杂 度 为 O(eloge)， 与 图 中 的 顶点 数 无 关 ， 因 此 该 算法 适合 于 求 边 
稀 玻 的 网 的 最 小 生成 树 。 
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图 3-39 ” 克 鲁 斯 卡尔 算法 构造 最 小 生成 树 的 过 程 


3.4.4 “拓扑 排序 和 关键 路 径 
1. AOV 网 


在 工程 领域 ， 一 个 大 的 工程 项 目 通常 被 划分 为 许多 较 小 的 子 工 程 〈 称 为 活动 )。 显 然 ， 当 
这 些 子 工程 都 完成 时 ， 整 个 工程 也 就 完成 了 。 在 有 向 图 中 ， 若 以 顶点 表示 活动 ， 用 有 向 边 表示 
活动 之 间 的 优先 关系 ， 则 称 这 样 的 有 向 图 为 以 顶点 表示 活动 的 网 (Activity On Vertex network， 
AOV 网 )。 在 AOV 网 中 ， 若 从 顶点 到 顶点 攻 有 一 条 有 向 路 径 ， 则 顶点 是 5 的 前 驱 ， 顶 点 


AOV 网 中 的 弧 表 示 了 活动 之 间 的 优先 关系 ， 也 可 以 说 是 一 种 活动 进行 时 的 制约 关系 。 

在 AOV 网 中 不 应 出 现 有 向 环 ， 若 存在 ， 则 意味 着 某 项 活动 必须 以 自身 任务 的 完成 为 先决 
条 件 ， 显 然 这 是 匾 雇 的 。 因 此 ， 若 要 检测 一 个 工程 是 否 可 行 ， 首 先 应 检查 对 应 的 AOV 网 是 否 
存在 回路 。 不 存在 回路 的 有 向 图 称 为 有 向 无 环 图 , 或 DAG (Directed Acycline Graph) 图 。 检 测 


则 该 AOV 网 中 必定 不 存在 环 。 
2. 拓扑 排序 及 其 算法 
拓扑 排序 是 将 AOV 网 中 的 所 有 项 点 排 成 一 个 线性 序列 的 过 程 ,并 且 该 序列 满足 : 若 在 AOV 
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网 中 从 顶点 立 到 六 有 一 条 路 径 ， 则 在 该 线性 序列 中 ， 顶 点 立 必 然 在 顶点 姜 之 前 。 

一 般 情 况 下 ， 假 设 AOV 图 代表 一 个 工程 计划 ， 则 AOV 网 的 一 个 拓扑 排序 就 是 一 个 工程 
顺利 完成 的 可 行 方案 。 对 AOV 网 进行 拓扑 排序 的 方法 如 下 。 

(1) 在 AOV 网 中 选择 一 个 入 度 为 0 (没有 前 驱 ) 的 顶点 且 输 出 它 。 

(2) 从 网 中 删除 该 顶点 及 与 该 项 点 有 关 的 所 有 弧 。 

(3) 重复 上 述 两 步 ， 直 到 网 中 不 存在 入 度 为 0 的 顶点 为 止 。 

执行 的 结果 会 有 两 种 情况 : 一 种 是 所 有 项 点 已 输出 ， 此 时 整个 拓扑 排序 完成 ， 说 明 网 中 不 
存在 回路 ; 另 一 种 是 尚 有 未 输出 的 项 点， 剩余 的 顶点 均 有 前 驱 顶 点 ， 表 明 网 中 存在 回路 ， 拓 扑 
排序 无 法 进行 下 去 。 对 于 图 3-40 〈a) 所 示 的 有 向 无 环 图 进行 拓扑 排序 ， 得 到 的 拓扑 序列 为 
6,1,4,3,2,5。 


As (3) (GS) 


图 3-40 ”拓扑 排序 过 程 


© 
© © 


d) 
当 有 向 图 中 无 环 时 ， 也 可 以 利用 深度 优先 遍历 进行 逆 拓 扑 排序 。 由 于 图 中 无 环 ， 从 图 中 某 


有 序 序列 。 拓 扑 排序 算法 的 时 间 复 杂 度 为 O(n+e)。 
3. AOE 网 


若 在 带 权 有 向 图 G 中 以 顶点 表示 事件 , 以 有 向 边 表示 活动 ,以 边 上 的 权 值 表示 该 活动 持续 
的 时 间 ， 则 这 种 带 权 有 向 图 称 为 用 边 表示 活动 的 网 (Activity On Edge network，AOE 网 )。 通常 
在 AOE 网 中 列 出 了 完成 预定 工程 计划 所 需 进 行 的 活动 、 每 项 活动 的 计划 完成 时 间 、 活 动 开 始 
或 结束 的 事件 以 及 这 些 事件 和 活动 间 的 关系 ， 从 而 可 以 分 析 该 项 工程 是 否 实际 可 行 并 估计 工程 
完成 的 最 短 时 间 ， 以 及 影响 工程 进度 的 关键 活动 :进一步 可 以 进行 人 力 、 物 力 的 调度 和 分 配 ， 
以 达到 缩短 工期 的 目的 。 
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在 用 AOE 网 表示 一 项 工程 计划 时 ， 顶 点 所 表示 的 事件 实际 上 就 是 某 些 活动 已 经 完成 、 某 
些 活动 可 以 动工 的 标志 。 具 体 来 说 ， 顶 点 所 表示 的 事件 是 指 该 项 点 所 有 进入 边 所 表示 的 活动 均 
已 完成 、 从 它 出 发 的 边 所 表示 的 活动 均 可 以 开始 的 一 种 事件 。 

一 般 情况 下 ， 每 项 工程 都 有 一 个 开始 事件 和 一 个 结束 事件 ， 所 以 在 AOE 网 中 至 少 有 一 个 
入 度 为 0 的 开始 项 点 ， 称 为 源 点 。 另 外 ， 应 有 一 个 出 度 为 0 的 结束 顶点 ， 称 为 汇 点 。AOE 网 中 
不 应 存在 有 向 回路 ， 否 则 整个 工程 无 法 完成 。 

与 AOV 网 不 同 ，AOE 网 所 关心 的 问题 如 下 。 

(1) 完成 该 工程 至 少 需 要 多 少时 间 ? 

(2) 哪些 活动 是 影响 整个 工程 进度 的 关键 ? 

由 于 AOE 网 中 的 某 些 活动 能 够 并 行 地 进行 ， 因 此 完成 整个 工程 所 需 的 时 间 是 从 开始 顶点 
到 结束 顶点 的 最 长 路 径 的 长 度 。 这 里 的 路 径 长 度 是 指 该 路 径 上 的 权 值 之 和 。 


4. 关键 路 径 和 关键 活动 


表示 汇 点 ， 则 引入 顶点 事件 的 最 早 、 最 晚 发 生 时 间 ， 活 动 的 最 早 、 最 晚 开 始 时 间 等 概念 。 

(1) 顶点 事件 的 最 早 发 生 时 间 ve0)。ve() 是 指 从 源 点 wo 到 vw 的 最 长 路 径 长 度 (时间)。 这 
个 时 间 决 定 了 所 有 从 忆 发 出 的 弧 所 表示 的 活动 能 够 开工 的 最 早 时 间 。 

ve0) 计 算 方 法 为 

ve(0)=0 

1 <ij>eT,l<j<n-l 
其 中 ,，T 是 所 有 到 达 顶 点 j 的 弧 的 集合 ，dut(<i, 产 ) 是 弧 <i, 户 上 的 权 值 ，n 是 网 中 的 顶点 数 ， 如 
图 3-41 (a) 所 示 。 

显然 ， 上 式 是 一 个 从 源 点 开始 的 递 推 公式 。 显 然 ， 必 须 在 的 所 有 前 驱 项 点 事件 的 最 早 发 
生 时 间 全 部 得 出 后 才能 计算 ve0)。 这 样 必须 对 AOE 网 进行 拓扑 排序 ， 然 后 按 拓 扑 有 序 序列 逐 
个 求 出 各 项 点 事件 的 最 早 发 生 时 间 。 

(2) 顶点 事件 的 最 晚 发 生 时 间 vl(D)。vlD) 是 指 在 不 推迟 整个 工期 的 前 提 下 ， 事 件 六 的 最 晚 
发 生 时 间 。 对 于 一 个 工程 来 说 ， 计 划 用 几 天 时 间 完 成 是 可 以 从 AOE 网 求 得 的 ， 其 数值 就 是 汇 
点 ww1 的 最 早 发 生 时 间 ve(n-1)， 而 这 个 时 间 也 就 是 vl(n-1)。 其 他 顶点 事件 的 Wl 应 从 汇 点 开始 ， 
逐步 向 源 点 方向 递 推 才能 求 得 ， 所 以 v1() 的 计算 公式 为 
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Vn—l)=ve(n-—l) 
VQ) = min{vI()) —dut(<i, 7 >)} <ij>esS,l<i<n-2 


其 中 ，S 是 所 有 从 项 点 i 发 出 的 弧 的 集合 ， 如 图 3-41 (b) 所 示 。 


O—、 O 


CN 
加 一 〇 
(a) 顺 推 事件 的 最 早 发 生 时 间 (b) 逆 推 事 件 的 最 时 发生 时 间 


图 3-41 推导 事件 的 最 早 、 最 晚 发 生 时 间 示 意图 


显然 ， 必 须 在 项 点 立 的 所 有 后 继 顶 点 事件 的 最 晚 发 生 时 间 全 部 得 出 后 才能 计算 v1(i)。 这 样 
必须 对 AOE 网 逆 拓 扑 排 序 ， 由 逆 拓 扑 序列 递 推 计算 各 顶点 的 wi 值 。 

(3) 活动 ok 的 最 早 开始 时 间 e( 太 。e( 甩 是 指 弧 <i, 产 所 表示 的 活动 a 最早 可 开工 时 间 。 

e(k) = ve(i) 

这 说 明 活 动 at 的 最 早 开 始 时 间 等 于 事件 v; 的 最 早 发 生 时 间 。 

(4) 活动 qx 的 最 晚 开 始 时 间 A 司 。1 有 D 是 指 在 不 推迟 整个 工期 的 前 提 下 ， 该 活动 的 最 晚 开 始 
时 间 。 若 活动 qx 由 弧 <i, 产 表示 ， 则 

I(F)= V7) -dut(<i,j >) 

对 于 活动 wk 来 说 ， 若 e( 司 = 有司 ， 则 表示 活动 at 是 关键 活动 ， 它 说 明 该 活动 最 早 可 开工 时 间 
与 整个 工程 计划 允许 该 活动 最 晚 的 开工 时 间 一 致 ， 施 工期 一 点 也 不 能 拖延 。 若 活动 w 不 能 按期 
完成 ， 则 工程 将 延期 ， 若 活动 a 提前 完成 ， 则 可 能 使 整个 工程 提前 完工 。 

由 关键 活动 组 成 的 路 径 是 关键 路 径 。 依 照 上 述 计算 关键 活动 的 方法 ， 即 可 形成 AOE 网 的 
关键 路 径 。 
3.4.5 “最 短路 径 

1， 单 源 点 最 短路 径 

所 谓 单 源 点 最 短路 径 ， 是 指 给 定 带 权 有 向 图 G 和 源 点 ww， 求 从 w 到 G 中 其 余 各 顶点 的 最 
短路 径 。 迪 杰 斯 特 拉 (Dijkstra) 提出 了 按 路 径 长 度 递增 的 次 序 产 生 最 短路 径 的 算法 , 其 思想 是 : 
把 网 中 所 有 的 顶点 分 成 两 个 集合 S 和 7T，S 集合 的 初 态 只 包含 顶点 w， 了 集合 的 初 态 为 网 中 除 
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Ww 之 外 的 所 有 顶点 。 凡 以 w 为 源 点 ， 已 经 确定 了 最 短路 径 的 终点 并 入 8 集合 中 ， 顶 点 集合 了 则 
是 尚未 确定 最 短路 径 的 顶点 的 集合 。 按 各 顶点 与 w 间 最 短路 径 长 度 递增 的 次 序 ,， 逐个 把 了 集合 
中 的 顶点 加 入 到 8 集合 中 去 ， 使 得 从 名 到 集合 中 各 项 点 的 路 径 长 度 始 终 不 大 于 从 w 到 了 集合 
中 各 项 点 的 路 径 长 度 。 


8 88 8 8 8 
8 88 8 3 8 


(a) 有 向 网 G (b) 网 G 的 邻接 矩阵 


图 3-42 有 向 网 G 及 其 邻接 矩阵 


表 3-1 迪 杰 斯 特 拉 算法 求解 图 3-42 中 顶点 w 到 Ww、v3、va、 
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终点 4 3 
nn " Eo 办 2 
| i | i 
(vo ™) (Vo, v2) (vo, V3 1) (Vo V3, Va V) 
| 
及 Co 9) Go 3) 
(vo v5, V4) (vo v3， V4) 
10 
(vo, v5) 
在 从 Ww 到 Vw、w、 | 在 从 Ww 到 Vv、w、 | 在 从 Ww 到 vi、v、 
tv 的 路 径 中 ，| 记 、 的 路 径 中 ， v4 的 路 径 中 ，(wvo， 在 从 Ww 到 w、w 的 vo 到 
说 明 Go, v5) 最 短 ， 则 将 Go, 25) 最 短 ， 则 将 3 va) 最 短 ， 则 将 | 路 径 中 ， Cvo» w， | 无 
顶点 vs 加 入 S 集 | 顶点 色 加 入 S 集 | 项 点 va 加 入 5 集 |vw， 世 最 短 ， 则 将 路 径 
合 ， 并 且 更 新 w 到 | 合 ， 并 且 更 新 w 到 | 合 ， 并 且 更 新 w 到 | 顶点 名 加 入 5S 集 合 - 
v4 的 路 径 多 、Wo 到 va 的 路 径 | vw 的 路 径 
集合 S {vo, vs} {Vo, vs, v3} { Vo, Vs, V3, Va} { Vo, V5, V3, V4, V2} 
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为 了 能 方便 地 求 出 从 w 到 了 集合 中 各 顶点 最 短路 径 的 递增 次 序 , 算法 实现 时 引入 一 个 辅助 
向 量 dist。 它 的 分 量 dist 思 表示 当前 求 出 的 从 w 到 终点 vi 的 最 短路 径 长 度 。 这 个 路 径 长 度 并 不 
一 定 是 最 后 的 最 短路 径 长 度 。 它 的 初始 状态 为 : 若 从 vw 到 vw， 有 弦 ， 则 dist 四 为 弧 上 的 权 值 ， 否 
则 ， 置 dist[ 四 为 c。 显 然 ， 长 度 为 dist[u] = minfdist]| v eV(G)} 的 路 径 就 是 从 vo 出 发 的 长 度 最 
短 的 一 条 最 短路 径 。 此 路 径 为 (wz 四 ， 这 时 顶点 xz 应 从 集合 了 中 删除 ， 将 其 并 入 集合 5。 

设 图 采用 邻接 矩阵 arcs 存储 ， 那么 每 次 选 出 一 个 顶点 并 使 之 并 入 集合 8 后 ， 就 根据 情况 
修改 了 集合 中 各 顶点 的 路 径 长 度 dist。 对 于 了 集合 中 的 某 一 个 顶点 i 来 说 ， 其 更 短路 径 可 能 为 
(vo，…， WW 问 。 也 就 是 说 ， 若 dist[x]+arcs[z] 回 < dist[i] ， 则 修改 dist[i]， 使 dist[i]= dist[u]+ 
arcs[u][i] 。 

对 了 集合 中 各 顶点 的 dist 进行 修改 后 ， 再 从 中 挑选 出 一 个 路 径 长 度 最 小 的 顶点 ， 从 了 集合 
中 删除 之 并 将 其 并 入 8 集合 。 依 此 类 推 ， 就 能 求 出 源 点 到 其 余 各 顶点 的 最 短路 径 长 度 。 


2. 每 对 顶点 间 的 最 短路 径 


若 每 次 以 一 个 顶点 为 源 点 ， 重 复 执行 迪 杰 斯 特 拉 算 法 n 次 ， 便 可 求 得 网 中 每 一 对 顶点 之 间 
的 最 短路 径 。 下 面 介绍 弗 洛 伊 德 〈Floyd) 提出 的 求 最 短路 径 的 算法 ， 该 算法 在 形式 上 要 更 简单 
-此 。 

弗 洛 伊 德 算法 思想 是 : 假设 图 采用 邻接 矩阵 的 方式 存储 , 需要 求 从 顶点 vi 到 vw 的 最 短路 径 。 
arcs[i] 中 表示 弧 vw vw) 的 权 值 ， 若 此 弧 不 存在 ， 则 权 值 为 区 别 于 有 效 权 值 的 一 个 数 。 如 果 存 在 
站 到 六 的 弧 ， 则 从 六 到 六 存在 一 条 长 度 为 arcs[D] 的 路 径 ， 该 路 径 不 一 定 是 最 短路 径 ， 尚 需 进 
行 n 次 试探 。 首 先 考虑 路 径 vi, vo, w) 是 否 存 在 〈 即 判别 路 径 〈 vo) 和 (wo, wy) 是 否 存在 )， 
车 存在 ， 则 比较 (vi yw) 与 《vi vo, Ww) 的 路 径 长 度 ， 取 较 短 者 为 从 vi 到 w 且 中 间 顶 点 的 序号 不 
大 于 0 的 最 短路 径 。 假 如 在 路 径 上 再 增加 一 个 项 点 vy， 也 就 是 说 ， 如 果 Gv …,w) 和 (vi, …， 
y) 分 别 是 当前 找到 的 中 间 顶 点 的 序号 不 大 于 0 的 名 到 vi 以 及 vi 到 的 最 短路 径 ， 那 么 (vi… 
yu …, 六 ) 就 有 可 能 是 从 六 到 立 且 中 间 项 点 的 序号 不 大 于 1 的 最 短路 径 。 将 它 与 已 经 得 到 的 从 
六 到 芒 的 中 间 顶 点 的 序号 不 大 于 0 的 最 短路 径 相 比 较 ， 从 中 选 出 中 间 顶 点 的 序号 不 大 于 1 的 最 
短路 径 之 后 , 再 增加 一 个 顶点 % 继 续 进行 试探 , 依 此 类 推 一 般 情 况 下 , 若 (v …, ve) 和 (vi … 
芒 ) 分 别 是 从 六 到 关 和 全 到 芒 的 中 间 顶 点 的 序号 不 大 于 有 1 的 最 短路 径 , 则 将 (ww ,wb …, YW) 


到 六 的 中 间 顶 点 的 序号 不 大 于 磊 的 最 短路 径 。 这 样 ， 经 过 次 试探 后 ， 最 后 求 得 的 必 是 从 六 到 
六 的 最 短路 径 。 按 此 方法 ， 可 以 同时 求 得 各 对 项 点 间 的 最 短路 径 。 
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3.5 查找 


3.5.1 查找 的 基本 概念 
1， 基 本 概念 


查找 是 一 种 常用 的 基本 运算 。 查 找 表 是 指 由 同一 类 型 的 数据 元 素 〈 或 记录 ) 构成 的 集合 。 
由 于 “集合 ”中 的 数据 元 素 之 间 存 在 着 完全 松散 的 关系 ， 因 此 ， 查 找 表 是 一 种 非常 灵活 的 数据 
结构 。 

对 查找 表 经 常 要 进行 的 两 种 操作 如 下 。 

(1) 查询 某 个 特定 的 数据 元 素 是 否 在 查找 表 中 。 

(2) 检索 某 个 特定 的 数据 元 素 的 各 种 属性 。 

通常 将 只 进行 这 两 种 操作 的 查找 表 称 为 静态 查找 表 。 

对 查找 表 经 常 要 进行 的 另外 两 种 操作 如 下 。 

(1) 在 查找 表 中 插入 一 个 数据 元 素 。 

(2) 从 查找 表 中 删除 一 个 数据 元 素 。 

若 需 要 在 查找 表 中 插入 不 存在 的 数据 元 素 ， 或 者 从 查找 表 中 删除 已 存在 的 某 个 数据 元 素 ， 
则 称 此 类 查找 表 为 动态 查找 表 。 

关键 字 是 数据 元 素 ( 或 记录 ) 的 某 个 数据 项 的 值 ， 用 它 来 识别 标识) 这 个 数据 元 素 。 主 
关键 字 是 指 能 唯一 标识 一 个 数据 元 素 的 关键 字 。 次 关键 字 是 指 能 标识 多 个 数据 元 素 的 关键 字 。 

根据 给 定 的 某 个 值 ， 在 查找 表 中 确定 是 否 存在 一 个 其 关键 字 等 于 给 定 值 的 记录 或 数据 元 
素 。 若 表 中 存在 这 样 的 一 个 记录 ， 则 称 查 找 成 功 ， 此 时 给 出 整个 记录 的 信息 ， 或 者 指出 记录 在 
查找 表 中 的 位 置 ， 若 表 中 不 存在 关键 字 等 于 给 定 值 的 记录 ， 则 称 查 找 不 成 功 ， 此 时 的 查找 结果 
用 一 个 “ 空 ”记录 或 “ 空 ”指针 表示 。 


2. 平均 查找 长 度 


对 于 查找 算法 来 说 ， 其 基本 操作 是 “将 记录 的 关键 字 与 给 定 值 进 行 比 较 ”。 因 此 ， 通 常 以 
“其 关键 字 和 给 定 值 进行 过 比较 的 记录 个 数 的 期 望 值 ”作为 衡量 查找 算法 好 坏 的 依据 。 

为 确定 记录 在 查找 表 中 的 位 置 ， 需 和 给 定 关键 字 值 进行 比较 的 次 数 的 期 望 值 称 为 查找 算法 
在 查找 成 功 时 的 平均 查找 长 度 。 

对 于 含有 n 个 记录 的 表 ， 查 找 成 功 时 的 平均 查找 长 度 定义 为 
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其 中 ， 忆 为 对 表 中 第 站 个 记录 进行 查找 的 概率 ， 且 六 忆 =1，-- 般 情况 下 ， 均 认为 查找 每 个 记 


录 的 概率 是 相等 的 , 即 PF1/m; C; 为 找到 表 中 其 关键 字 与 给 定 值 相 等 的 记录 时 (为 第 i 个 记录 )， 
和 给 定 值 已 进行 过 比较 的 关键 字 个 数 ， 显 然 ，C; 随 查找 方法 的 不 同 而 不 同 。 


3.5.2 ”静态 查找 表 的 查找 方法 
1. 顺序 查找 


顺序 查找 的 基本 思想 是 :从 表 的 一 端 开 始 ， 逐 个 将 记录 的 关键 字 和 给 定 值 比较 ， 若 找到 一 
个 记录 的 关键 字 与 给 定 值 相等 ， 则 查找 成 功 ， 若 整个 表 中 的 记录 均 比 较 过 ， 仍 未 找到 关键 字 等 
于 给 定 值 的 记录 ， 则 查找 失败 。 

顺序 查找 的 方法 对 于 顺序 存储 方式 和 链 式 存储 方式 的 查找 表 都 适用 。 

从 顺序 查找 的 过 程 可 知 ，C; 取 决 于 所 查 记录 在 表 中 的 位 置 。 若 需 查找 的 记录 正好 是 表 中 的 
第 一 个 记录 ， 仪 需 比较 一 次 ， 若 查找 成 功 时 找到 的 是 表 中 的 最 后 一 个 记录 ， 则 需 比 较 n 次 。 从 
表 尾 开始 查找 时 正好 相反 。 一 般 情况 下 ，C=n-it1， 因 此 在 等 概率 情况 下 ， 顺 序 查找 成 功 的 平 
均 查 找 长 度 为 
n+l 
- 王 

也 就 是 说 ， 成 功 查找 的 平均 比较 次 数 约 为 表 长 的 一 半 。 若 所 查 记录 不 在 表 中 ， 则 必须 进行 
n 次 (不 设 监 视 哨 ， 设 置 监视 哨 时 为 n+l 次 ) 比较 才能 确定 失败 。 监 视 哨 是 指 查 找 表 用 一 维 数 
组 存储 时 ， 将 待 查找 的 记录 放置 在 查找 表 的 第 一 个 记录 之 前 或 最 后 一 个 记录 之 后 ， 从 而 在 查找 
过 程 中 不 需要 对 数组 元 素 的 下 标 进 行 合法 性 检查 。 

与 其 他 查找 方法 相 比 , 顺序 查找 方法 在 ” 值 较 大 时 ,其 平均 查找 长 度 较 大 , 查找 效率 较 低 。 
但 这 种 方法 也 有 优点 ， 那 就 是 算法 简单 且 适 应 面 广 ， 对 查找 表 的 结构 没有 要 求 ， 无 论 记录 是 否 
按 关键 字 有 序 排 列 均 可 应 用 。 


2. 折 半 查找 
设 查 找 表 的 元 素 存储 在 一 维 数组 t[1,…,n] 中 ， 在 表 中 的 元 素 已 经 按 关 键 字 递增 方式 排序 的 


情况 下 ， 进 行 折 半 查找 的 方法 是 : 首先 将 待 查 元 素 的 关键 字 (Key) 值 与 表 r 中 间 位 置 上 (下 
标 为 mid) 记录 的 关键 字 进 行 比较 ， 若 相等 ， 则 查找 成 功 ， 若 key>r[mid] key， 则 说 明 待 查 记录 


n n 
ASLs = > BC =L DitD= 
i=1 


i=l 
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只 可 能 在 后 半 个 子 表 r[mid+1,…,a 中 ， 下 一 步 应 在 后 半 个 子 表 中 进行 查找 ; 若 key<r[mid] .key， 
说 明 待 查 记录 只 可 能 在 前 半 个 子 表 [1,…, mid-H] 中 ， 下 一 步 应 在 r 的 前 半 个 子 表 中 进行 查找 ， 
这 样 逐步 缩小 范围 ， 直 到 查找 成 功 或 子 表 为 空 时 失败 为 止 。 

【函数 】 设 有 一 个 整 型 数组 中 的 元 素 是 按 非 递减 的 方式 排列 的 ， 在 其 中 进行 折 半 查找 的 算 
法 为 : 


int Bsearch(int 7[], int low, int high, int key) 
证 元 素 存 储 在 数组 r[low..high]， 用 折 半 查找 的 方法 在 数组 rt 中 找 值 为 key 的 元 素 */ 
人 # 若 找到 返回 该 元 素 的 下 标 ， 否 则 返回 -1%/ 
{ int mid; 
while(low <= high) { 
mid = (low+high)/2 ; 
if (key =— r[mid]) returm mid; 
else if (key<r[mid]) high = mid-1; 
else low = mid+l1; 
}/*while*/ 
return -1; 
}/*Bsearch*/ 


【函数 】 设 有 一 个 整 型 数组 中 的 元 素 是 按 非 递减 的 方式 排列 的 ， 在 其 中 进行 折 半 查找 的 递 
归 算 法 如 下 : 


int Bsearch_rec(int 1[],int low,int high,int key) 
放 元 素 存储 在 数组 t[low..high]， 用 折 半 查找 的 方法 在 数组 rt 中 找 值 为 key 的 元 素 */ 
族 车 找到 返回 该 元 素 的 下 标 ， 否 则 返回 -1*/ 
{ intmid; 
if (low <= high) { 
mid = (low+high)/2 ; 
if (key =— r[mid]) 
return mid: 
else if (key<r[mid]) 
return Bsearch rec(r,low,mid-1,key); 
else 
return Bsearch rec(r,mid+],high,key); 
Jaifw/ 
Teturm -1; 


}H/*Bsearch rec*/ 
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折 半 查找 的 性 能 分 析 如 下 。 

折 半 查找 的 过 程 可 以 用 一 棵 二 又 树 描述 ， 方 法 是 以 当前 查找 区 间 的 中 间 位 置 序号 作为 根 ， 
左 半 个 子 表 和 右 半 个 子 表 中 的 记录 序号 分 别 作为 根 的 左 子 树 和 右 子 树 上 的 结 点 ， 这 样 构造 的 二 
又 树 称 为 折 半 查找 判定 树 。 例 如 ， 具 有 11 个 结 点 的 折 半 查找 判定 树 如 图 3-43 所 示 。 

从 折 半 查找 判定 树 可 以 看 出 ， 查 找 成 功 时 ， 折 半 查 找 的 过 程 恰好 走 了 一 条 从 根 结 点 到 被 查 
找 结 点 的 路 径 ， 与 关键 字 进 行 比 较 的 次 数 即 为 被 查找 结 点 在 树 中 的 层 数 。 因 此 ， 折 半 查 找 在 查 
找 成 功 时 进行 比较 的 关键 字 个 数 最 多 不 超过 树 的 深度 ， 而 具有 n 个 结 点 的 判定 树 的 深度 为 
|log,z|+1， 所 以 折 半 查找 在 查找 成 功 时 和 给 定 值 进行 比较 的 关键 字 个 数 最 多 为 | logs n |+1。 

给 判定 树 中 所 有 结 点 的 空 指针 域 加 一 个 指向 方形 结 点 的 指针 ， 称 这 些 方形 结 点 为 判定 树 的 
外 部 结 点 (与 之 相对 ， 称 那些 圆 形 结 点 为 内 部 结 点 )， 如 图 3-44 所 示 。 那 么 折 半 查找 不 成 功 的 
过 程 就 是 走 了 一 条 从 根 结 点 到 外 部 结 点 的 路 径 。 与 给 定 值 进 行 比较 的 关键 字 个 数 等 于 该 路 径 上 
pe 因此 折 半 查找 在 查找 不 成 功 时 和 给 定 值 进行 比较 的 关键 字 个 数 最 多 也 不 会 超过 
log,n |+1。 


(® 
(3 (9 
YW WW 昌 
© DY WW 


图 3-43 具有 11 个 结 点 的 折 半 查找 判定 树 图 3-44 加 上 外 部 结 点 的 判定 树 


那么 折 半 查找 的 平均 查找 长 度 是 多 少 呢 ? 为 了 方便 起 见 ， 不 妨 设 结 点 总 数 为 n=2*-1， 则 判 

定 树 是 深度 为 h=log,(n+1) 的 满 二 又 树 。 在 等 概率 情况 下 ， 折 半 查 找 的 平均 查找 长 度 为 
| 
ASLL -> E> = 一 logs+D-1 

当 n 值 较 大 时 ，ASL,, xlog,(n+])-1。 

折 半 查找 比 顺序 查找 的 效率 要 高 ， 但 它 要 求 查找 表 进 行 顺 序 存储 并 且 按 关键 字 有 序 排列 。 
因此 ， 当 需要 对 表 进 行 插入 或 删除 操作 时 ， 需 要 移动 大 量 的 元 素 。 所 以 折 半 查找 适用 于 表 不 易 
变动 ， 且 又 经 常 进行 查找 的 情况 。 
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3. 分 块 查找 


分 块 查找 又 称 索 引 顺 序 查 找 ， 是 对 顺序 查找 方法 的 一 种 改进 ， 其 效率 介 于 顺序 查找 与 折 半 
查找 之 间 。 

在 分 块 查 找 过 程 中 ， 首 先 将 表 分 成 若干 块 ， 每 一 块 的 关键 字 不 一 定 有 序 ， 但 块 之 间 是 有 序 
的 ， 即 后 一 块 中 所 有 记录 的 关键 字 均 大 于 前 一 个 块 中 最 大 的 关键 字 。 此 外 ， 还 建立 了 一 个 “ 索 
引 表 ”， 索 引 表 按 关 键 字 有 序 ， 如 图 3-45 所 示 。 


23|13|14| 9 |10|21|34|43|45|39|25|49|61|59|75|50|87|53 
图 3-45 表 及 其 索引 表 


因此 ， 分 块 查找 过 程 分 为 两 步 : 第 一 步 在 索引 表 中 确定 待 查 记录 所 在 的 块 : 第 二 步 在 块 内 
顺序 查找 。 

由 于 分 块 查找 实际 上 是 两 次 查找 的 过 程 ， 因此 其 平均 查找 长 度 应 该 是 两 次 查找 的 平均 查找 
长 度 〈 索 引 查找 与 块 内 查找 ) 之 和 ， 即 


ASLw = 五 + 
其 中 ，Z6 为 查找 索引 表 的 平均 查找 长 度 ，L, 为 块 内 查找 时 的 平均 查找 长 度 。 
分 块 查找 时 ， 可 将 长 度 为 n 的 表 均匀 地 分 成 5 块 ， 每 块 含有 s 个 记录 ， 有 b=|2| 在 


等 概率 查找 的 情况 下 ， 块 内 查找 的 概率 为 ， 每 块 的 查找 概率 为 ， 若 用 顺序 查找 确定 元 素 所 
在 的 块 ， 则 分 块 查找 的 平均 查找 长 度 为 


1 忆 .1 亡 ， b+l s+l 1/n 
ASL =1,.+L, = 十 a 二 = +s |+1 
wh tl B21 5 之 区 -可 3 ] 


可 见 ， 其 平均 查找 长 度 不 仅 与 表 长 n 有 关 ， 而 且 与 每 一 块 的 记录 数 s 有 关 。 可 以 证 明 ， 当 
s 取 Vn 时 ,ASLw 取 最 小 值 V +1， 此 时 的 查找 效率 较 顺序 查找 要 好 得 多 ， 但 远 不 及 折 半 查找 。 
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考虑 到 索引 表 是 一 个 有 序 表 ， 因 此 可 以 用 折 半 查找 确定 元 素 所 在 的 块 。 
3.5.3 动态 查找 表 


动态 查找 表 的 特点 是 表 结 构 本 身 是 在 查找 过 程 中 动态 生成 的 ， 即 对 于 给 定 值 key， 若 表 中 
存在 关键 字 等 于 key 的 记录 ， 则 查找 成 功 返 回 ， 否 则 插入 关键 字 为 key 的 记录 。 


1. 二 又 排序 权 


1) 二 叉 排 序 树 的 定义 
二 叉 排 序 树 又 称 二 又 查找 树 ， 它 或 者 是 一 棵 空 树 ， 或 者 是 具有 以 下 性 质 的 二 叉 树 。 
(1) 若 它 的 左 子 树 非 空 ， 则 左 子 树 上 所 有 结 点 的 
值 均 小 于 根 结 点 的 值 。 (46) 
(2) 若 它 的 右 子 树 非 空 ， 则 右 子 树 上 所 有 结 点 的 值 (13) (54) 
均 大 于 根 结 点 的 值 。 @ C8) (i0) 
(3) 左 、 右 子 树 本 身 是 二 又 排序 树 。 
图 3-46 为 一 棵 二 又 排序 树 。 四 (® 
2) 二 叉 排序 树 的 查找 过 程 © 
因为 二 叉 排 序 树 的 左 子 树 上 所 有 结 点 的 关键 字 均 图 3-46 二 叉 排序 树 示意 图 
小 于 根 结 点 的 关键 字 ， 右 子 树 上 所 有 结 点 的 关键 字 均 大 
于 根 结 点 的 关键 字 ， 所 以 在 二 又 排序 树 上 进行 查找 的 过 程 为 : 二 叉 排序 树 非 空 时 ， 将 给 定 值 与 
根 结 点 的 关键 字 值 相 比 较 ， 若 相等 ， 则 查找 成 功 ， 若 不 相等 ， 则 当 根 结 点 的 关键 字 值 大 于 给 定 
值 时 ， 下 一 步 到 根 的 左 子 树 中 进行 查找 ， 否 则 到 根 的 右 子 树 中 进行 查找 。 若 查找 成 功 ， 则 查找 
过 程 是 走 了 一 条 从 树 根 到 所 找到 结 点 的 路 径 ， 否 则 ， 查 找 过 程 终止 于 一 棵 空 的 子 树 。 


设 二 又 排序 树 采 用 二 又 链表 存储 ， 结 点 的 类 型 定义 如 下 : 
typedef struct Tnode{ 
int data; 谍 结 点 的 关键 字 值 */ 


struct Tnode *lchild,*rchild; 。 “”/* 指 向 左 、 右 子 树 的 指针 */ 
}BSTnode, *BSTree; 


【函数 】 二 又 排序 树 的 查找 算法 。 

BSTree SearchBST(BSTree root, int key, BSTree *father) 

人 # 在 root 指向 根 的 二 又 排序 树 中 查找 键 值 为 key 的 结 点 */ 
人 # 若 找到 ， 返 回 该 结 点 的 指针 :否则 返回 空 指针 NULLS/ 
{ BSTree p= root: *father=NULL: 
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while (p && p->datal=key) { 
*father = p; 
1f(key <p->data) p=p->lchild; 
else p=p->rchild; 
YW/*while*/ 
Teturn p; 
}/*SearchBST*/ 
3) 在 二 叉 排序 树 中 插入 结 点 的 操作 
二 又 排序 树 是 通过 依次 输入 数据 元 素 并 把 它们 插入 到 二 又 树 的 适当 位 置 构造 起 来 的 ， 具 体 
的 过 程 是 : 每 读 入 一 个 元 素 ， 建 立 一 个 新 结 点 。 若 二 又 排 序 树 非 空 ， 则 将 新 结 点 的 值 与 根 结 点 
的 值 相 比较 ， 如 果 小 于 根 结 点 的 值 ， 则 插入 到 左 子 树 中 ， 和 否则 插入 到 右 子 树 中 ， 若 二 又 排序 树 
为 空 ， 则 新 结 点 作为 二 叉 排序 树 的 根 结 点 。 设 关键 字 序 列 为 {46，25，54，13，29，91}， 则 整 
个 二 又 排序 树 的 构造 过 程 如 图 3-47 所 示 。 


(40) (49) (46) 
(@) G@3 @5) (5 (3) QC) (3) Cy 
(a) (b) (c) (d) (f) (g) 


(e) 
图 3-47 二 又 排 序 树 的 构造 过 程 
【函数 】 二 又 排序 树 的 插入 算法 。 


int InsertBST(BSTree *root, int newkey) 
人 # 在 *root 指向 根 的 二 又 排序 树 中 插入 一 个 键 值 为 newkey 的 结 点 ， 插 入 成 功 则 返回 0， 否则 返回 -1#/ 


{ BSTree spf; 
s= (BSTree)malloc(sizeof(BSTnode)): 
1f (!s) retum —1; 
s->data = newkey; s->lchild = NULL: s->rchild = NULL: 
p= SearchBST(*root.newkey,&f); /# 寻 找 插 入 位 置 #/ 
if(p) retum -1; /# 键 值 为 newkey 的 结 点 已 在 树 中 ， 不 再 插入 */ 
if(!f) *root=s; /# 若 为 空 树 ， 键 值 为 newkey 的 结 点 为 树 根 */ 
else if (newkey <f->data) f->lchild = s; ”/* 作 为 父 结 点 的 左 孩 子 插入 */ 
else f->rchild = s; 记 作 为 父 结 点 的 右 孩 子 插入 */ 
Teturn 0; 


}/*InsertBST*/ 
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从 上 面 的 插入 过 程 还 可 以 看 到 ， 每 次 插入 的 新 结 点 都 是 二 又 排 序 树 上 新 的 叶子 结 点 ， 因 此 
插入 结 点 时 不 必 移动 其 他 结 点 ， 仅 需 改动 某 个 结 点 的 孩子 指针 。 这 就 相当 于 在 一 个 有 序 序列 上 
插入 一 个 记录 而 不 需要 移动 其 他 记录 。 这 表明 在 二 又 排序 树 进行 查找 具有 类 似 于 折 半 查找 的 特 
性 ， 二 又 排 序 树 可 采用 链表 存储 结构 ， 因 此 是 动态 查找 表 的 一 种 适宜 表示 。 

另外 ， 由 于 一 棵 二 又 排序 树 的 形态 完全 由 输入 序列 决定 ， 所 以 在 输入 序列 已 经 有 序 的 情况 
下 ， 所 构造 的 二 又 排序 树 是 一 棵 单 枝 树 。 例 如 ， 对 于 关键 字 序列 (12，18，23，45，60)， 建 
立 的 二 又 排序 树 如 图 3-48 所 示 ， 这 种 情况 下 的 查找 效率 与 顺序 查找 的 效率 相同 。 


四 四 
(9 ® 
© 


图 3-48 ”由 关键 字 序列 (12，18，23，45，60) 创建 的 二 叉 排序 树 


4) 在 二 叉 排序 树 中 删除 结 点 的 操作 

在 二 又 排序 树 中 删除 一 个 结 点 ， 不 能 把 以 该 结 点 为 根 的 子 树 都 删除 ， 只 能 删除 这 个 结 点 并 
仍旧 保持 二 又 排序 树 的 特性 。 也 就 是 说 ， 在 二 又 排序 树 上 删除 一 个 结 点 相当 于 在 有 序 序列 中 删 
除 一 个 元 素 。 

假设 要 在 二 又 排序 树种 删除 结 点 部 〈P 指向 被 删除 结 点 )，* 为 其 双亲 结 点 ， 则 该 操作 可 
分 为 3 种 情况 : 结 点 部 为 叶子 结 点 ; 结 点 部 只 有 左 子 树 或 者 只 有 右 子 树 ; 结 点 部 的 左 子 树 、 
右 子 树 均 存 在 。 

(1) 车 结 点 * 为 叶子 结 点 且 *p 不 是 根 结 点 ， 即 p->lchild 及 p->rchild 均 为 室 ， 则 由 于 删 去 
叶子 结 点 后 不 破坏 整 棵 树 的 结构 ， 因 此 只 需 修改 郑 的 双亲 结 点 壮 的 相应 指针 即 可 。 


f->lchild 〈 或 人 >rchild) =NULL: 


(2) 若 结 点 六 只 有 左 子 树 或 者 只 有 右 子 树 且 *p 不 是 根 结 点 ， 此 时 只 要 将 的 左 子 树 或 右 
子 树 接 成 其 双亲 结 点 时 的 左 子 树 〈 或 右 子 树 )， 即 令 


f->lchild (或 f>rchild) = p->lchild: 
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在 >lchild (或 f>rchild) = p->rchild: 


(3) 若 部 结 点 的 左 、 右 子 树 均 不 空 ， 则 删除 *p 结 点 时 应 将 其 左 子 树 、 右 子 树 连 接 到 适当 
的 位 置 ， 并 保持 二 又 排序 树 的 特性 。 可 采用 以 下 两 种 方法 进行 处 理 : 一 是 令 郊 的 左 子 树 为 时 
的 左 子 树 〈 若 部 不 是 根 结 点 且 *p 是 壮 的 左 子 树 ， 否 则 为 右 子 树 ), 而 将 *p 的 右 子 树 下 接 到 中 序 
遍历 时 *p 的 直接 前 驱 结 点 *s (*s 结 点 是 *p 的 左 子 树 中 最 右 下 方 的 结 点 〉 的 右 孩 子 指针 上 ; 二 
是 用 部 的 中 序 直 接 前 驱 〈 或 后 继 ) 结 点 *s 代替 部 结 点 ， 然 后 删除 *s 结 点 ， 如 图 3-49 所 示 。 


f root 


f root 


图 3-49 删除 二 叉 排序 树 中 具有 两 个 子 树 的 结 点 示意 图 


从 二 叉 排 序 树 的 定义 可 知 , 中 序 遍 历 二 叉 排序 树 可 得 到 一 个 关键 字 有 序 的 序列 。 这 也 说 明 ， 
一 个 无 序 序列 可 以 通过 构造 一 棵 二 叉 排 序 树 而 得 到 一 个 有 序 序列 ， 构 造 二 叉 排 序 树 的 过 程 就 是 
对 无 序 序列 进行 排序 的 过 程 。 

2. 平衡 二 又 树 


平衡 二 又 树 又 称 为 AVL 树 ， 它 或 者 是 一 棵 空 树 ， 或 者 是 具有 下 列 性 质 的 二 又 树 。 它 的 左 
子 树 和 右 子 树 都 是 平衡 二 又 树 ， 且 左 子 树 和 右 子 树 的 高 度 之 差 的 绝对 值 不 超过 1。 若 将 二 叉 树 
结 点 的 平衡 因子 (Balance Factor，BF ) 定义 为 该 结 点 左 子 树 的 高 度 减 去 其 右 子 树 的 高 度 ， 则 平 
衡 二 叉 树 上 所 有 结 点 的 平衡 因子 只 可 能 是 -1、0 和 1。 只 要 树 上 有 一 个 结 点 的 平衡 因子 的 绝对 
值 大 于 1， 则 该 二 又 树 就 是 不 平衡 的 。 

分 析 二 又 排序 树 的 查找 过 程 可 知 ， 只 有 在 树 的 形态 比较 均匀 的 情况 下 ， 查 找 效 率 才能 达到 
最 佳 。 因 此 ， 和 希望 在 构造 二 又 排序 树 的 过 程 中 ， 保 持 其 为 一 棵 平衡 二 又 树 。 

使 二 叉 排序 树 保持 平衡 的 基本 思想 是 : 每 当 在 二 又 排序 树 中 插入 一 个 结 点 时 ， 首 先 检查 是 
否 因 插 入 破坏 了 平衡 。 若 是 ， 则 找 出 其 中 的 最 小 不 平衡 二 叉 树 ， 在 保持 二 又 排序 树 特性 的 情况 
下 ， 调 整 最 小 不 平衡 子 树 中 结 点 之 间 的 关系 ， 以 达到 新 的 平衡 。 所 谓 最 小 不 平衡 子 树 ， 是 指 高 
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插入 结 点 最 近 且 以 平衡 因子 的 绝对 值 大 于 1 的 结 点 作为 根 的 子 树 。 

1) 平衡 二 又 树 上 的 插入 操作 

一 般 情 况 下 , 假设 由 于 在 二 又 排序 树 上 插入 结 点 而 失去 平衡 的 最 小 子 树 根 结 点 的 指针 为 a， 
也 就 是 说 ，a 所 指 结 点 是 离 插入 结 点 最 近 且 平衡 因子 的 绝对 值 超过 1 的 祖先 结 点 ， 那 么 ， 失 去 
平衡 后 进行 调整 的 规律 可 归纳 为 以 下 4 种 情况 。 

(1) LL 型 单 向 右 旋 平衡 处 理 。 如 图 3-50 所 示 ， 由 于 在 *a 〈 即 结 点 A) 的 左 子 树 的 左 子 树 
上 插入 新 结 点 ， 使 *a 的 平衡 因子 由 1 增 至 2， 导 致 以 *a 为 根 的 子 树 失 去 平衡 ， 因 此 需 进行 一 次 
向 右 的 顺 时 针 旋转 操作 。 


AG) 网 
BQ0) A 8 OE 


BL BR B' BR 
ml nh 


(a) 插入 结 点 前 (b) 新 结 点 插入 B 的 左 (c) 右 旋 平衡 处 理 后 
子 树 后 ，B 的 左 子 树 长 高 


图 3-50 单 向 右 旋 平 衡 处 理 示意 图 
(2) RR 型 单 向 左旋 平衡 处 理 。 如 图 3-51 所 示 ， 由 于 在 *a〈 即 结 点 A) 的 右 子 树 的 右 子 树 


上 插入 新 结 点 ， 使 *a 的 平衡 因子 由 -1 变 为 2， 导致 以 *a 为 根 的 子 树 失去 平衡 ， 因 此 需 进行 一 
次 向 左 的 逆 时 针 旋 转 操作 。 


BL BR 

h h 

(a) 插入 结 点 前 (b) 新 结 点 插入 B 的 右 (c) 左旋 平衡 处 理 后 
子 树 后 ，B 的 右 子 树 长 高 


Br Br A， Bi 
hrl 


图 3-51 单 向 左旋 平衡 处 理 示 意图 


(3) LR 型 先 左 后 右 双向 旋转 平衡 处 理 。 如 图 3-52 所 示 ， 由 于 在 *a( 即 结 点 A〉 的 左 子 树 
的 右 子 树 上 插入 新 结 点 ， 使 *a 的 平衡 因子 由 1 增 至 2， 导致 以 *a 为 根 结 点 的 子 树 失去 平衡 ， 因 


第 3 章 数据 结构 “ 国 159 医 


此 需 进 行 两 次 旋转 〈 先 左旋 后 右 旋 ) 操作 。 


C 
B A 
A 
(a) 插入 结 点 前 (b) 新 结 点 插入 B 的 右 (c) 左旋 平衡 处 理 后 (d) 右 旋 平衡 处 理 后 


子 树 后 ，B 的 右 子 树 长 高 
图 3-52 ” 先 左 后 右 双向 平衡 处 理 示意 图 
(4) RL 型 先 右 后 左 双向 旋转 平衡 处 理 。 如 图 3-53 所 示 ， 由 于 在 *a〈 即 结 点 A) 的 右 子 树 


的 左 子 树 上 插入 新 结 点 ， 使 *a 的 平衡 因子 由 -1 变 为 -2， 导 致 以 *a 为 根 结 点 的 子 树 失去 平衡 ， 
因此 需 进 行 两 次 旋转 ( 先 右 旋 后 左旋 ) 操作 。 


C 
A B 
AL CL Cn Br 
h h 
(a) 插入 结 点 前 (b) 新 结 点 插入 B 的 左 (c) 右 旋 平衡 处 理 后 (d) 左旋 平衡 处 理 后 


子 树 后 ，B 的 左 子 树 长 高 
图 3-53” 先 右 后 左 双向 平衡 处 理 示意 图 


2) 平衡 二 又 树 上 的 删除 操作 

在 平衡 二 叉 树 上 进行 删除 操作 比 插入 操作 更 复杂 。 若 符 删 结 点 的 两 个 子 树 都 不 为 室 ， 就 用 
该 结 点 左 子 树 上 的 中 序 遍 历 的 最 后 一 个 结 点 《或 其 右 子 树 上 的 第 一 个 结 点 ) 替换 该 结 点 ， 将 情 
况 转化 为 待 删除 的 结 点 只 有 一 个 子 树 后 再 进行 处 理 。 当 一 个 结 点 被 删除 后 ， 从 被 删 结 点 到 树 根 
的 路 径 上 所 有 结 点 的 平衡 因子 都 需要 更 新 。 对 于 每 一 个 位 于 该 路 径 上 的 平衡 因子 为 432 的 结 点 
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来 说 ， 都 要 进行 平衡 处 理 。 
3. B 树 
一 棵 加 阶 的 B_ 树 ， 或 为 空 树 ， 或 为 满足 下 列 特性 的 力 又 树 。 
01D 树 中 每 个 结 点 最 多 有 m 棵 子 树 。 
(2) 车 根 结 点 不 是 叶子 结 点 ， 则 最 少 有 两 梨子 桂 。 
(3) 除根 之 外 的 所 有 非 从 器 结 点 最 少 有 | 2 棵 子 树 。 
(4) 所 有 的 非 终端 结 点 中 包含 下 列 数据 信息 
(n,Ao,Ki,A1,K2,A,,**, Kn,An) 


其 中 ,Ki( 二 1,2…,n) 为 关键 字 ， 且 Ki<Kin( 二 1,2…,n-1); 4Xi=0,1,…,n) 为 指向 子 树 根 结 点 的 指针 ， 
且 指针 4 所 指 子 树 中 所 有 结 点 的 关键 字 均 小 于 Ki( 谨 1,2,…,n)，4 所 指 子 树 中 所 有 结 点 的 关键 


字 均 大 于 Ks, # 为 结 点 中 关键 字 的 个 数量 淇 [至 |-1 Pop m1]. 


(5) 所 有 的 叶子 结 点 都 出 现在 同一 层次 上 ， 并 且 不 带 信息 〈 可 以 看 作 是 外 部 结 点 或 查找 失 
败 的 结 点 ， 实 际 上 这 些 结 点 不 存在 ， 指 向 这 些 结 点 的 指针 为 空 )。 
一 棵 4 阶 的 B_ 树 如 图 3-54 所 示 。 


图 3-54 4 阶 B 树 示意 图 


由 B 树 的 定义 可 知 ， 在 B_ 树 上 进行 查找 的 过 程 是 : 首先 在 根 结 点 所 包含 的 关键 字 中 查找 
给 定 的 关键 字 ， 若 找到 则 成 功 返 回 ， 否 则 确定 待 查找 的 关键 字 所 在 的 子 树 并 继续 进行 查找 ， 直 
到 查找 成 功 或 查找 失败 〈 指 针 为 室 ) 时 为 止 。 
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B-_ 树 上 的 插入 和 删除 运算 较为 复杂 ， 因 为 要 保证 运算 后 结 点 中 关键 字 的 个 数 大 于 等 于 


| 和 | 及 结 点 的 “分 交 ” 及 “合并 ” 问题 


在 B 树 中 插入 一 个 关键 字 时 , 不 是 在 树 中 增加 一 个 叶子 结 点 ,而 是 首先 在 低层 的 某 个 非 终 
端 结 点 中 添加 一 个 关键 字 ， 若 该 结 点 中 关键 字 的 个 数 不 超 过 m1， 则 完成 插入 ， 否 则 ， 要 进行 
结 点 的 “分 裂 ” 处理。 所谓“ 分 裂 ”， 就 是 把 结 点 中 处 于 中 间 位 置 上 的 关键 字 取 出 来 插入 到 其 
父 结 点 中 ， 并 以 该 关键 字 为 分 界线 ， 把 原 结 点 分 成 两 个 结 点 。“ 分裂 ”过 程 可 能 会 一 直 持续 到 
树 根 。 

同样 ， 在 B 树 中 删除 一 个 结 点 时 ， 首 先 找到 关键 字 所 在 的 结 点 ， 若 该 结 点 在 含有 信息 的 最 
后 一 层 ， 且 其 中 关键 字 的 数目 不 少 于 | 邓 | -1 ， 则 完成 副 除 ， 否 则 需 进行 结 点 的 “合并 ” 运 种。 


若 待 删除 的 关键 字 所 在 的 结 点 不 在 含有 信息 的 最 后 一 层 , 则 将 该 关键 字 用 其 在 B 树 中 的 后 继 替 
代 ， 然 后 删除 其 后 继 元 素 ， 即 将 需要 处 理 的 情况 统一 转化 为 在 含有 信息 的 最 后 一 层 再 进行 删除 
运算 。 
3.5.4 哈 希 表 

1， 哈 希 表 的 定义 


在 前 面 讨论 的 几 种 查找 方法 中 ， 由 于 记录 在 存储 结构 中 的 相对 位 置 是 随机 的 ， 所 以 查找 时 
都 要 通过 一 系列 与 关键 字 的 比较 才能 确定 被 查 记录 在 表 中 的 位 置 。 也 就 是 说 ， 这 类 查找 都 是 以 
关键 字 的 比较 为 基础 的 ， 而 哈 希 表 则 通过 计算 一 个 以 记录 的 关键 字 为 自 变量 的 函数 〈 称 为 哈 希 
函数 ) 来 得 到 该 记录 的 存储 地 址 ， 所 以 在 哈 希 表 中 进行 查找 操作 时 ， 需 用 同一 哈 希 函 数 计算 得 
到 待 查 记录 的 存储 地 址 ， 然 后 到 相应 的 存储 单元 去 获得 有 关 信 息 再 判定 查找 是 否 成 功 。 

根据 设 定 的 哈 希 函 数 H(key) 和 处 理 冲 突 的 方法 , 将 一 组 关键 字 映 射 到 一 个 有 限 的 连续 的 地 
址 集 (区 间 ) 上 ， 并 以 关键 字 在 地 址 集中 的 “ 像 ” 作 为 记录 在 表 中 的 存储 位 置 ， 这 种 表 称 为 哈 
希 表 ， 这 一 映射 过 程 称 为 哈 希 造 表 或 散 列 ， 所 得 的 存储 位 置 称 为 哈 希 地 址 或 散 列 地 址 。 

对 于 某 个 哈 希 函数 及 和 两 个 关键 字 Ki 和 KK， 如 果 KxK， 而 成 KD)=EKR2)， 则 称 为 冲突 。 
具有 相同 哈 希 函数 值 的 关键 字 对 该 哈 希 函数 来 说 称 为 同义词 。 

一 般 情 况 下 ,冲突 只 能 尽 可 能 减少 而 不 能 完全 避免 ， 因 为 哈 希 函数 是 从 关键 字 集合 到 地 址 
集合 的 映像 。 通 常 ， 关 键 字 集合 比较 大 ， 它 的 元 素 包 含 所 有 可 能 的 关键 字 ， 而 地 址 集合 的 元 素 
仅 为 哈 希 表 中 的 地 址 值 。 假 设 关 键 字 集 合 为 某 种 高 级 语言 的 所 有 标识 符 ， 如 果 一 个 标识 符 对 应 
一 个 存储 地 址 ， 那 就 不 会 发 生 冲 突 了 ， 但 这 是 不 可 能 也 没有 必要 的 ， 因 为 存储 空间 难以 满足 ， 
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而 且 任何 一 个 源 程序 都 不 会 使 用 这 么 多 标识 符 。 因此 在 一 般 情况 下 , 哈 希 函数 是 一 个 压缩 映像， 
冲突 是 不 可 避免 的 。 

对 于 哈 希 表 ， 主 要 考虑 两 个 问题 ， 一 是 如 何 构造 哈 希 函数 ， 二 是 如 何 解决 冲突 。 

2。 哈 希 函 数 的 构造 方法 


常用 的 哈 希 函数 构造 方法 有 直接 定 址 法 、 数 字 分 析 法 、 平 方 取 中 法 、 折 私法 、 随 机 数 法 和 
除 留 余数 法 等 。 

对 于 哈 希 函数 的 构造 ， 应 解决 好 两 个 主要 问题 。 

(1) 哈 希 函数 应 是 一 个 压缩 映像 函数 ， 它 应 具有 较 大 的 压缩 性 ， 以 节省 存储 空间 。 

(2) 哈 希 函数 应 具有 较 好 的 散 列 性 ， 虽 然 冲 突 是 不 可 避免 的 ， 但 应 尽量 减少 。 

要 减少 冲突 ， 就 要 设法 使 哈 希 函数 尽 可 能 均匀 地 把 关键 字 映 射 到 存储 区 的 各 个 存储 单元 ， 
这 样 就 可 以 提高 查找 效率 。 在 构造 哈 希 函 数 时 ， 一 般 都 要 对 关键 字 进 行 计 算 ， 且 尽 可 能 使 关键 
字 的 所 有 组 成 部 分 都 能 起 作用 。 

3. 处 理 冲 突 的 方法 

解决 冲突 就 是 为 出 现 冲突 的 关键 字 找 到 另 一 个 “ 空 ” 的 哈 希 地 址 。 在 处 理 冲突 的 过 程 中 ， 
可 能 得 到 一 个 地 址 序列 瓦 (=12,…, 妇 。 常 见 的 处 理 冲突 的 方法 有 以 下 几 种 。 

(1) 开放 定 址 法 。 

HA=(H(key)+d) % m i=1,2,°"%,K(k<m-l) 

其 中 ，H(key) 为 蛤 希 函 数 ，m 为 哈 希 表 表 长 ，4; 为 增 量 序列 。 

常见 的 增 量 序列 有 以 下 3 种 。 

@ qdi= 1,2,3,…,m-1， 称 为 线性 探测 再 散 列 。 

回 丰 =12 -12.22-22.32…, 二 12 (k< 多 )， 称 为 二 次 探测 再 散 列 。 

@ d= 伪 随机 数 序 列 ， 称 为 随机 探测 再 散 列 。 

最 简单 的 产生 探测 序列 的 方法 是 进行 线性 探测 ， 也 就 是 发 生 冲突 时 ,顺序 地 到 存储 区 的 下 
一 个 单元 进行 探测 。 

例如 ， 某 记录 的 关键 字 为 key， 哈 希 函 数值 Hl(key)=j。 若 在 哈 希 地 址 j 发 生 了 冲突 ( 即 此 
位 置 已 存放 了 其 他 记录 ), 则 对 哈 希 地 址 六 1 进行 探测 , 车 仍 然 有 冲突 , 再 对 地 址 j+2 进行 探测 ， 
依 此 类 推 ， 直 到 找到 一 个 “ 空 ”的 单元 并 将 元 素 存 入 哈 希 表 。 

例如 ， 设 关键 码 序列 为 “47，34，13，12，52，38，33，27，3 ”， 哈 希 表 表 长 为 11， 哈 希 
函数 为 Hash(key)=key mod 11， 则 
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Hash(47) =47 MOD 11 =3, Hash(34)=34MOD 11 = 1， 
Hash(13) = 13 MOD 11 =2，Hash(12)= 12 MOD 11 = 1， 
Hash(52) = 52 MOD 11 = 8，Hash(38) = 38 MOD 11 = 5， 
Hash(33) = 33 MOD 11 =0, Hash(27) = 27 MOD 11 =5, 
Hash(3) = 3 MOD 11=3。 

使 用 线性 探测 法 解决 冲突 构造 的 哈 希 表 如 下 : 


1 


2 3 4 5 6 7 8 | 10 
EENEENENNICICIENENIENENIN 


由 哈 希 函数 得 到 关键 字 47、34、13、52、38、33 的 哈 希 地 址 没有 冲突 ， 元 素 直接 存 入 。 

对 于 元 素 12, 其 哈 希 地 址 为 1, 但 是 该 地 址 中 已 经 存 入 元 素 34, 因此 由 丽 =(Hash(12)+1) mod 
11=2， 再 试探 哈 希 地 址 2, 但 该 地 址 已 被 元 素 13 占用 , 发 生 冲突 ; 再 计算 及 =(Hash(12)+2) mod 
11=3， 发 生 冲 突 ( 地 址 3 被 元 素 47 占用 );， 再 计算 友 =(Hash(12)+3) mod 11=4， 空 闲 ， 因 此 将 
元 素 12 存 入 哈 希 地 址 为 4 的 单元 。 元 素 27 和 3 也 是 通过 解决 冲突 后 存 入 的 。 

线性 探测 法 可 能 使 第 i 个 哈 希 地 址 的 同义词 存 入 第 计 1 个 哈 希 地 址 ， 这 样本 应 存 入 第 计 1 
个 哈 希 地 址 的 元 素 变 成 了 第 寺 2 个 哈 希 地 址 元 素 的 同义词 ，……* ， 因 此 ， 可 能 出 现 很 多 元 素 在 
相 邻 的 哈 希 地 址 上 “聚集 ”起 来 的 现象 ， 大 大 降低 了 查找 效率 。 

那么 在 查找 时 就 有 3 种 可 能 : 第 一 种 情况 是 在 某 一 位 置 上 查 到 了 关键 字 等 于 key 的 记录 ， 
查找 成 功 ， 第 二 种 情况 是 按 探 测序 列 查 不 到 关键 字 为 key 的 记录 且 又 遇 到 了 空 单元 ， 这 时 表明 
元 素 不 在 表 中 ， 表 示 查 找 失 败 ; 第 三 种 情况 是 查 遍 全 表 ， 未 查 到 指定 关键 字 且 符号 表 存 储 区 已 
满 ， 需 进行 溢出 处 理 。 

线性 探测 法 思路 清楚 ， 算 法 简单 ， 但 也 存在 以 下 缺点 。 

@ 溢出 处 理 需 另 编程 序 。 一 般 可 另外 设立 一 个 溢出 表 ， 专 门 用 来 存放 上 述 哈 希 表 中 放 不 
下 的 记录 。 实 现 溢 出 表 最 简单 的 结构 是 顺序 表 ， 查 找 方法 可 用 顺序 查找 。 

@ 线性 探测 法 很 容易 产生 聚集 现象 。 所 谓 聚 集 现象 ， 就 是 存 入 哈 希 表 的 记录 在 表 中 连 成 
一 片 。 当 哈 希 函数 不 能 把 关键 字 很 均匀 地 散 列 到 哈 希 表 中 时 ， 尤 其 容易 产生 聚集 现象 ， 这 种 情 
况 下 会 增加 探测 的 次 数 ， 从 而 降低 了 查找 效率 。 

用 户 可 以 采取 多 种 方法 减少 聚集 现象 的 产生 ,二 次 探测 再 散 列 和 随机 探测 再 散 列 是 两 种 有 
效 的 方法 。 

(2) 链 地 址 法 。 链 地 址 法 (或 拉链 法 ) 是 一 种 经 常 使 用 且 很 有 效 的 方法 。 它 在 查找 表 的 每 
一 个 记录 中 增加 一 个 链 域 ， 链 域 中 存放 下 一 个 具有 相同 哈 希 函数 值 的 记录 的 存储 地 址 。 利 用 链 
域 ， 就 把 若干 个 发 生 冲突 的 记录 链接 在 一 个 链表 内 。 当 链 域 的 值 为 NULL 时 ， 表 示 已 没有 后 继 
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记录 了 。 因 此 ， 对 于 发 生 冲 突 时 的 查找 和 插入 操作 就 跟 线 性 表 一 样 了 。 


例如 ， 哈 希 表 表 长 为 11、 哈 希 函 数 为 Hash(key)=key mod 11， 对 于 关键 码 序列 “47，34， 
13，12，52，38，33，27，3” 使 用 链 地 址 法 构造 的 哈 希 表 如 图 3-55 所 示 。 


图 3-55 ”用 链 地 址 法 解决 冲突 构造 哈 希 表 
在 图 3-55 所 示 的 哈 希 表 中 进行 成 功 查 找 的 平均 查找 长 度 ASL 为 
ASL=(6X1+3X2)/9= 1.34 
(3) 再 哈 希 法 。 
HRH(key) (1.2.… 虽 


哈 希 地 址 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |s|9|nm 
ee 
33 34 || 13 || 47 38 52 
A 中小 | 
12 3 27 
国民 


RH 均 是 不 同 的 哈 希 函数 ， 即 在 同义词 发 生地 址 冲突 时 计算 另 一 个 哈 希 函数 地 址 ， 直 到 冲 


突 不 再 发 生 。 这 种 方法 不 易 产 生 聚 集 现 象 ， 但 增加 了 计算 时 间 。 


(4) 建立 一 个 公共 游 出 区 。 无 论 由 哈 希 函数 得 到 的 哈 希 地 址 是 什么 ， 一 旦 发 生 剖 突 ， 都 填 


入 到 公共 溢出 区 中 。 
4. 险 希 表 的 查找 


在 哈 希 表 中 进行 查找 操作 时 ,用 与 存 入 元 素 时 相同 的 哈 希 函数 和 冲突 处 理 方法 计算 得 到 待 
查 记录 的 存储 地 址 ， 然 后 到 相应 的 存储 单元 获得 有 关 信 息 再 判定 查找 是 否 成 功 。 因 此 ， 哈 希 查 


找 的 特点 如 下 。 
(1) 虽然 哈 希 表 在 关键 字 与 记录 的 存储 位 置 之 间 建立 了 直接 映像 , 但 


于 “ 神 突 ” 的 产生 ， 


使 得 哈 希 表 的 查找 过 程 仍然 是 一 个 给 定 值 和 关键 字 进 行 比较 的 过 程 。 因 此 ， 仍 需要 以 平均 查找 


长 度 衡 量 哈 希 表 的 查找 效率 。 


(2) 在 查找 过 程 中 需要 和 给 定 值 进 行 比较 的 关键 字 的 个 数 取决 于 下 列 3 个 因素 : 哈 希 函数 、 
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处 理 冲 突 的 方法 和 哈 希 表 的 装填 因子 。 
一 般 情况 下 ， 冲 突 处 理 方法 相同 的 哈 希 表 ， 其 平均 查找 长 度 依赖 于 哈 希 表 的 装填 因子 。 哈 
希 表 的 装填 因子 定义 为 


。_ 表 中 装 入 的 记录 数 
哈 希 表 的 长 度 
a 标志 着 哈 希 表 的 装 满 程度 。 直 观 地 看 ，a 越 小 ， 发 生 冲突 的 可 能 性 就 越 小 ， 反 之 ，a 越 
大 ， 表 中 已 填 入 的 记录 越 多 ， 再 填 记 录 时 ， 发 生 冲突 的 可 能 性 就 越 大 ， 则 查找 时 ， 给 定 值 需 与 
之 进行 比较 的 关键 字 的 个 数 也 就 越 多 。 


3.6 排序 
3.6.1 排序 的 基本 概念 


假设 含 n 个 记录 的 文件 内 容 为 {R1,R2…,R,}， 相 应 的 关键 字 为 {h, 司 …, 局 } 。 经 过 排序 确定 
一 种 排列 {Ri,Riz,…,Rin}， 使 得 它们 的 关键 字 满足 以 下 递增 或 递减 ) 关系 : < 局 <…< 5 (或 
> > > ) 

若 在 待 排 序 的 一 个 序列 中 ，R; 和 的 关键 字 相 同 ， 即 如， 且 在 排序 前 R; 领 先 于 态 ， 那 
么 在 排序 后 ， 如 果 和 乌 的 相对 次 序 保持 不 变 ，Ri 仍 领先 于 态 ， 则 称 此 类 排序 方法 为 稳定 的 。 
若 在 排序 后 的 序列 中 有 可 能 出 现 贸 领先 于 Ri 的 情形 ， 则 称 此 类 排序 为 不 稳定 的 。 

(1) 内 部 排序 。 内 部 排序 指 待 排序 记录 全 部 存放 在 内 存 中 进行 排序 的 过 程 。 

(2) 外 部 排序 。 外 部 排序 指 待 排序 记录 的 数量 很 大 ， 以 至 于 内 存 不 能 容纳 全 部 记录 ， 在 排 
序 过 程 中 尚 需 对 外 存 进行 访问 的 排序 过 程 。 

在 排序 过 程 中 需要 进行 下 列 两 种 基本 操作 : 比较 两 个 关键 字 的 大 小 ; 将 记录 从 一 个 位 置 移 
动 到 另 一 个 位 置 。 前 一 种 操作 对 大 多 数 排序 方法 来 说 都 是 必要 的 ， 后 一 种 操作 可 以 通过 改变 记 
录 的 存储 方式 来 避免 。 
3.6.2 ”简单 排序 

1. 直接 插入 排序 

直接 插入 排序 是 一 种 简单 的 排序 方法 ， 具 体 做 法 是 : 在 插入 第 i 个 记录 时 ，R1、Rs、… 
Ri 已经 排 好 序 ， 这 时 将 Ri 的 关键 字 右 依 次 与 关键 字 大 1!、 友 ;等 进行 比较 ， 从 而 找到 应 该 插入 
的 位 置 并 将 Ri 插入 ， 插 入 位 置 及 其 后 的 记录 依次 向 后 移动 。 


本 :cc 屋 
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【算法 】 直 接 插入 排序 算法 。 


Void Insertsort(int data[], int n ) 
人 # 将 数组 data[0] 一 data[n-1] 中 的 个 整数 按 非 递减 有 序 的 方式 进行 排列 */ 
{ inti,j; 
int tmp; 
fori=1;i<n;it+){ 
if (datali] < data[i-1]) { 
tmp = data[i]: data[i] = data[i-1]: 
for( =i-1; >=0&&data[j] > tmp; j--) data[j+1] = data[j]: 
data[j+1] = tmp; 
Jifr/ 
}/*for*/ 
}/*Insertsort*/ 


直接 插入 排序 法 在 最 好 情况 下 《〈 待 排序 列 已 按 关 键 码 有 序 )， 每 趟 排序 只 需 作 1 次 比较 且 
不 需要 移动 元 素 ， 因 此 7 个 元 素 排序 时 的 总 比较 次 数 为 n-1 次 ， 总 移动 次 数 为 0 次 。 在 最 坏 情 
况 下 元 素 已 经 逆序 排列 )， 进 行 第 i 趟 排序 时 ， 待 插入 的 记录 需要 同 前 面 的 i 个 记录 都 进行 7 


Ln 
次 比较 ,因此 ,总 比较 次 数 为 也 1= 下 一。 排序 过 各 中 第; 赵 排序 时 移动 记录 的 次 数 为 寺 1 
i=] 


(包括 移 进 、 移 出 bmp)， 总 移动 次 数 为 六 C+D = 人 3- 。 
i=2 


直接 插入 排序 是 一 种 稳定 的 排序 方法 , 其 时 间 复 杂 度 为 O(n”)。 在 排序 过 程 中 仅 需 要 一 个 元 
素 的 辅助 空间 ， 空 间 复杂 度 为 0(1)。 


2. 冒 泡 排 序 


n 个 记录 进行 冒 泡 排 序 的 方法 是 :首先 将 第 一 个 记录 的 关键 字 和 第 二 个 记录 的 关键 字 进行 
比较 ， 若 为 逆序 ， 则 交换 这 两 个 记录 的 值 ， 然 后 比较 第 二 个 记录 和 第 三 个 记录 的 关键 字 ， 依 此 
类 推 ， 直 到 第 n-l1 个 记录 和 第 n 个 记录 的 关键 字 比 较 过 为 止 。 上 述 过程 称 为 第 一 趟 冒 泡 排序 ， 
其 结果 是 关键 字 最 大 的 记录 被 交换 到 第 个 记录 的 位 置 上 。 然后 进行 第 二 趟 冒 泡 排序 , 对 前 n-1 
个 记录 进行 同样 的 操作 ， 其 结果 是 关键 字 次 大 的 记录 被 交换 到 第 二 1 个 记录 的 位 置 上 。 最 多 进 
行 n-1 趟 ， 所 有 记录 有 序 排列 。 若 在 某 趟 冒 泡 排序 过 程 没 有 进行 相 邻 位 置 的 元 素 交 换 处 理 ， 则 
可 结束 排序 过 程 。 

冒 泡 排序 法 在 最 好 情况 下 〈 待 排序 列 已 按 关 键 码 有 序 )， 只 需 做 1 趟 排序 ， 元 素 的 比较 次 
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数 为 n-1 且 不 需要 交换 元 素 , 因此 总 比较 次 数 为 n-1 次 , 总 交换 次 数 为 0 次 。 在 最 坏 情况 下 (元 
素 已 经 逆序 排列 )， 进 行 第 j 趟 排序 时 ， 最 大 的 产 1 个 元 素 已 经 排 好 序 ， 其 余 的 二 (1D) 个 元 素 需 


要 进行 nj 次 比较 和 nj 次 交换 ， 因此 总 比较 次 数 为 区 0n- D)= 2 2 ， 总 交换 次 数 为 


n-l | (Or -1D 
-六 =。 
3 


冒 泡 排序 是 一 种 稳定 的 排序 方法 ， 其 时 间 复 杂 度 为 O0)。 在 排序 过 程 中 仅 需 要 一 个 元 素 
的 辅助 空间 用 于 元 素 的 交换 ， 空 间 复杂 度 为 0(1)。 


3. 简单 选择 排序 


n 个 记录 进行 简单 选择 排序 的 基本 方法 是 : 通过 n-i (1<i<n) 在 次 关键 字 之 间 的 比较 ， 从 
nn-itl 个 记录 中 选 出 关键 字 最 小 的 记录 ， 并 和 第 i 个 记录 进行 交换 ， 当 i 等 于 n 时 所 有 记录 有 序 
排列 。 

【算法 】 简 单 选择 排序 算法 。 


void SelectSort(int data[], int n ) 
作 将 数组 data 中 的 个 整数 按 非 递 碱 有 序 的 方式 进行 排列 */ 
{inti,j, k, tmp; 
for(i=0;i<n-1;it+){ 
k=i; 
forG =itl;j<n;j+t+) 鼎 找 出 最 小 关键 字 的 下 标 */ 
if (data[j] <data[k])) k=j; 
if(k!=D){ 
tmp = data[i]; data[i] = data[k]: data[k] = tmp: 
Jaifr/ 
}/*for*/ 
}/*SelectSort*/ 


简单 选择 排序 法 在 最 好 情况 下 《 待 排序 列 已 按 关键 码 有 序 )， 不 需要 移动 元 素 ， 因 此 "个 
元 素 排 序 时 的 总 移动 次 数 为 0 次 。 在 最 二 情况 下 元 素 忆 经 过 序 排列 )， 前 2 超 中 ， 每 肖 排 序 
移动 记录 的 次 数 都 为 3 次 《两 个 数组 元 素 交 换 值 )， 其 后 不 再 移动 元 素 ， 共 进行 -1 站 序 
总 移动 次 数 为 36-10)2。 无 论 在 哪 种 情况 下 ， 元 素 的 总 比较 次 数 为 守 o -六 = 2 ， 


i=l 


简单 选择 排序 是 一 种 不 稳定 的 排序 方法 ， 其 时 间 复 杂 度 为 OGr)。 在 排序 过 程 中 仅 需 要 一 
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个 元 素 的 辅助 空间 用 于 数组 元 素 值 的 交换 ， 空 间 复杂 度 为 O(1)。 


3.6.3 希 尔 排序 


希 尔 排序 又 称 为 “缩小 增 量 排序 ”， 它 是 对 直接 插入 排序 方法 的 改进 。 

希 尔 排序 的 基本 思想 是 : 先 将 整个 待 排 记录 序列 分 割 成 若干 子 序列 ， 然 后 分 别 进行 直接 插 
入 排序 , 待 整个 序列 中 的 记录 基本 有 序 时 ,再 对 全 体 记录 进行 一 次 直接 插入 排序 。 具 体 做 法 是 : 
先 取 一 个 小 于 n 的 整数 qi 作为 第 一 个 增 量 ， 把 文件 的 全 部 记录 分 成 qi 个 组 ， 即 将 所 有 距离 为 
在 倍数 序号 的 记录 放 在 同一 个 组 中 , 在 各 组 内 进行 直接 插入 排序 ; 然后 取 第 二 个 增 量 4,(q2<41)， 
重复 上 述 分 组 和 排序 工作 ， 依 此 类 推 ， 直 到 所 取 的 增 量 d=1(4<4i41<…<4d2<q1)， 即 所 有 记录 放 


在 同一 组 进行 直接 插入 排序 为 止 。 


当 增 量 序列 为 “$，3，1” 时 ， 和 希 尔 插入 排序 过 程 如 下 。 
[初始 关键 字 ]: 48 37 64 96 75 12 26 48 54 03 


48 咏 
37 26 
64 48 
96 
75 
第 一 赵 排 序 结果 :12 26 48 54 03 48 37 
12 54 37 
26 03 
48 48 


第 二 趟 排序 结果 :12 03 48 37 26 48 54 
第 三 趟 排序 结果 : 03 12 26 37 48 48 54 


【函数 】 用 希 尔 排序 方法 对 整 型 数组 进行 非 递减 排序 。 


void ShellSort(int data[], int n) 
{ int *delta, k, i, t, dk, j; 
k=n: 


放 从 k=n 开始 ， 重 复 k=k/2 运算 ， 直 到 等 于 1， 所 得 k 值 的 序列 作为 增 量 序列 存 入 delta*/ 


delta = (int *)malloc(sizeof(int)*(n/2)); 
i= 0: 
do{ 

k=k/2; delta[i++] = kk; 
}while(k > 1); 


54 


03 
96 


96 
96 
75 


3 
75 


75 
96 


} 


希 尔 排序 是 一 种 不 稳定 的 排序 方法 ， 据 统计 分 析 其 时 间 复 杂 度 约 为 On)， 在 排序 过 程 中 
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i=0; 
while ((dk = delta[i])>0) { 
for(k = deltali]; k <n:; ++k) 
if (data[k] < data[k-dk]) { /# 将 元 素 data[k] 插 入 到 有 序 增 量 子 表 中 */ 
t= data[k]; 人 备份 待 插入 的 元 素 ， 空 出 一 个 元 素 位 置 所 
for( =k-dk;j >= 0 && t< datalj]:j = dk) 
data[j+dk] = data[j]: /# 寻 找 插入 位 置 的 同时 元 素 后 移 所 
data[j+dk] =t: /# 找 到 插入 位 置 ， 插 入 元 素 所 
Jifw 
+ /# 取 下 一 个 增 量 值 / 
}/*while*/ 
* ShellSort */ 


仅 需 要 一 个 元 素 的 辅助 空间 用 于 数组 元 素 值 的 交换 ， 空 间 复 杂 度 为 0(1)。 
3.6.4 快速 排序 


快速 排序 的 基本 思想 是 : 通过 一 趟 排序 将 待 排 的 记录 划分 为 独立 的 两 部 分 ， 称 为 前 半 区 和 
后 半 区 ， 其 中 ， 前 半 区 中 记录 的 关键 字 均 不 大 于 后 半 区 记录 的 关键 字 ， 然 后 再 分 别 对 这 两 部 分 


记录 继续 进行 快速 排序 ， 从 而 使 整个 序列 有 序 。 


一 趟 快速 排序 的 过 程 称 为 一 次 划分 ， 具 体 做 法 是 : 附设 两 个 位 置 指示 变量 i 和 jj, 它们 的 初 
值 分 别 指向 序列 的 第 一 个 记录 和 最 后 一 个 记录 。 设 枢 轴 记录 (通常 是 第 一 个 记录 ) 的 关键 字 为 
pivot, 则 首先 从 7 所 指 位 置 起 向 前 搜索 ,找到 第 一 个 关键 字 小 于 pivot 的 记录 时 将 该 记录 向 前 移 
到 i 指示 的 位 置 ， 然 后 从 i 所 指 位 置 起 向 后 搜索 ， 找 到 第 一 个 关键 字 大 于 pivot 的 记录 时 将 该 记 


录 向 后 移 到 j 所 指 位 置 ， 重复 该 过 程 直至 i 与 j 相 等 为 止 。 


【 


函数 】 快 速 排 序 过 程 中 的 划分 。 


int partition(int data[], int low, int high) 


{ 


人 # 用 data[low] 作 为 枢 轴 元 素 pivot 进行 划分 */ 
放 使 得 data[low..i-1] 均 不 大 于 pivot，data[i+1..high] 均 不 小 于 pivot*/ 
inti,j; intpivot; 
pivot= data[low]: i=low; j= high: 
while(i <j) { 启 从 数组 的 两 端 交 蔡 地 向 中 间 扫 描 */ 
while(i <] && data[] >= pivot) j--; 
data[i] = datafj]: 族 比 枢 轴 元 素 小 者 往 前 移 */ 
while (1 <] && data[i] <= pivot) 1++; 


co 
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data[j] = data[]; 上 # 比 枢 轴 元 素 大 者 向 后 移 状 
} 
data[i] = pivot; 
return i; 


} 
【函数 】 用 快速 排序 方法 对 整 型 数组 进行 非 递 减 排序 。 


void quickSort(int data[], int low, int high) 
# 用 快速 排序 方法 对 数组 元 素 data[low.high] 作 非 递减 排序 所 


{ 
if (low<high) { 
int loc = partition(data, low, high); /# 进 行 划分 4/ 
quicksort(data,low,loc-1); /# 对 前 半 区 进行 快速 排序 所 
quicksort(data.loc+l,high); 旋 对 后 半 区 进行 快速 排序 */ 
} 
}/* quickSort */ 


快速 排序 算法 的 时 间 复杂 度 为 O(nlogzn), 在 所 有 算法 复杂 度 为 此 数量 级 的 排序 方法 中 , 快 
速 排序 被 认为 是 平均 性 能 最 好 的 一 种 。 但 是 ， 若 初始 记录 序列 按 关键 字 有 序 或 基本 有 序 时 ， 即 
每 次 划分 都 是 将 序列 划分 为 某 一 半 序列 的 长 度 为 0 的 情况 ， 此 时 快速 排序 的 性 能 退化 为 时 间 复 
杂 度 是 Oo02)。 快 速 排序 是 不 稳定 的 排序 方法 。 

3.6.5“ 堆 排序 


对 于 nn 个 元 素 的 关键 字 序列 {KK2,…,K}， 当 且 仅 当 满足 下 列 关系 时 称 其 为 堆 ， 其 中 2i 和 
2 计 ] 应 不 大 于 m。 
8 ja 
EE 

若 将 此 序列 对 应 的 一 维 数组 ( 即 以 一 维 数组 作为 序列 的 存储 结构 ) 看 成 是 一 个 完全 二 又 树 ， 
则 堆 的 含义 表明 ， 完 全 二 叉 树 中 所 有 非 终端 结 点 的 值 均 不 小 于 (或 不 大 于 ) 其 左 、 右 孩子 结 点 
的 值 。 因 此 ， 在 一 个 堆 中 ， 堆 顶 元 素 ( 即 完全 二 叉 树 的 根 结 点 ) 必 为 序列 中 的 最 大 元 素 〈 或 最 
小 元 素 )， 并 且 堆 中 的 任 一 棵 子 树 也 都 是 堆 。 若 堆 顶 为 最 小 元 素 ， 则 称 为 小 根 堆 ， 若 堆 顶 为 最 
大 元 素 ， 则 称 为 大 根 堆 。 

堆 排 序 的 基本 思想 是 : 对 一 组 待 排序 记录 的 关键 字 ， 首 先 按 堆 的 定义 排 成 一 个 序列 〈 即 建 
立 初始 堆 )， 从 而 可 以 输出 堆 项 的 最 大 关键 字 〈 对 于 大 根 堆 而 言 )， 然 后 将 剩余 的 关键 字 再 调整 
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成 新 堆 ， 便 得 到 次 大 的 关键 字 ， 如 此 反复 ， 直 到 全 部 关键 字 排 成 有 序 序列 为 止 。 
初始 堆 的 建立 方法 是 :将 待 排序 的 关键 字 分 放 到 一 棵 完全 二 叉 树 的 各 个 结 点 中 (此 时 完全 
二 叉 树 并 不 一 定 具备 堆 的 特性 )， 显然， 所 有 i>| 引 的 结 点 到 都 没有 子 结 点 ， 以 这 样 的 为 根 


的 子 树 已 经 是 堆 ， 因 此 初始 建 堆 可 从 完全 二 叉 树 的 第 (= 四 个 结 点 抚 开始 ， 通 过 调整 ， 
拓 步 使 以 对 。、 厨 。，、 古 | 。、、 看 、 丰 为 要 的 了 村 江 的 定义 
加 外 上 


-2 

在 对 为 根 的 子 树 建 堆 的 过 程 中 ， 可 能 需要 交换 Ki 与 Ki; (或 oi) 的 值 ， 如 此 一 来 ， 以 
Ki 或 Kzir1) 为 根 的 子 树 可 能 不 再 满足 堆 的 定义 ， 则 应 继续 以 Ki; (或 i+1) 为 根 进行 调整 ， 
如 此 层 层 地 递 推 下 去 ， 可 能 会 一 直 延 伸 到 叶子 结 点 时 为 止 。 这 种 方法 就 像 过 筛子 一 样 ， 把 最 大 
(或 最 小 ) 的 关键 字 一 层 一 层 地 筛选 出 来 ， 最 后 输出 堆 项 的 最 大 《或 最 小 ) 元 素 。 

【函数 】 将 一 个 整 型 数组 中 的 元 素 调整 成 大 根 堆 。 

void HeapAdjust(int data[], int s, int m) 

必 在 data[s..m] 所 构成 的 一 个 元 素 序 列 中 ， 除 了 data[s] 外 ， 其 余 元 素 均 满足 大 项 堆 的 定义 */ 

人 # 调 整 元 素 data[s] 的 位 置 ， 使 data[s..m] 成 为 一 个 大 项 堆 */ 


{int tmp, j; 
tmp = data[s]; 族 备 份 元 素 data[s]， 为 其 找到 适当 位 置 后 再 插入 */ 
for( = 2*s+1;j <=m;j=j*2+1) { /# 沿 值 较 大 的 孩子 结 点 向 下 筛选 # 
让 6 <m&& data[j] < data[j+1]) +H:; ”/ 导 是 值 较 大 的 元 素 的 下 标 */ 
if (tmp >= data[j]) break: 
data[s] = data[j]; s=j; 人 # 用 s 记录 待 插入 元 素 的 位 置 ( 下 标 )*/ 
}/*fors/ 
data[s] = tmp; 族 将 备份 元 素 插入 由 s 所 指出 的 插入 位 置 */ 
HW/*HeapAdjust*/ 


调整 成 新 堆 : 假设 输出 堆 顶 元 素 之 后 ， 以 堆 中 最 后 一 个 元 素 蔡 代 ， 那 么 根 结 点 的 左 、 右 子 
树 均 为 堆 ， 此 时 只 需 自 上 至 下 进行 调整 即 可 。 
【函数 】 用 堆 排 序 方法 对 整 型 数组 进行 非 递 减 排序 。 


void HeapSort(int data[], int n) 上 数组 data[0..n-1] 中 的 n 个 元 素 进行 堆 排 序 */ 
{ inti; 

int tmp; 

for(i= mn/2-1; i>= 0; --i) /# 将 data[0..n-1] 调 整 为 大 根 堆 */ 


HeapAdjust(data, 1, n-l): 
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for(i=n-1:;i> 0; -1 
{ tmp= data[l0]: data[0] = datafi]; 


datali] = tmp: /# 堆 顶 元 素 data[0] 与 序列 末 的 元 素 data 自 交换 */ 
HeapAdjust(data,0.i-1); 人 # 待 排 元 素 的 个 数 减 1， 将 data[0..i-1] 重 新 调整 为 大 根 堆 */ 
Jsfors/ 
}/* HeapSort */ 


为 序列 55.60,40,10,80,65,15,5,75) 建立 初始 大 根 堆 的 过 程 如 图 3-56 所 示 ， 调 整 为 新 堆 的 
过 程 如 图 3-57 所 示 。 


(3) 
(WY WY YY OO WG VO 
(©) (QW () (WV 


图 3-56 初始 大 根 堆 建 立 过 程 示意 图 


图 3-57 调整 为 新 堆 的 过 程 示意 图 


对 于 记录 数 较 少 的 文件 来 说 ， 堆 排序 的 优越 性 并 不 明显 ， 但 对 于 大 量 的 记录 来 说 ， 堆 排序 
是 很 有 效 的 。 堆 排序 的 整个 算法 时 间 是 由 建立 初始 堆 和 不 断 调 整 堆 这 两 部 分 时 间 构 成 的 。 可 以 
证 明 ， 堆 排序 算法 的 时 间 复 杂 度 为 O(nlogn) 。 此 外 ， 堆 排序 只 需要 一 个 记录 大 小 的 辅助 空间 。 
堆 排序 是 一 种 不 稳定 的 排序 方法 。 
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3.6.6 ”归并 排序 

所 谓 “ 归 并 ”， 是 将 两 个 或 两 个 以 上 的 有 序 文件 合并 成 为 一 个 新 的 有 序 文 件 。 归 并 排序 的 
一 种 实现 方法 是 把 一 个 及 个 记录 的 无 序 文件 看 成 是 由 n 个 长 度 为 1 的 有 序 子 文件 组 成 的 文件 ， 
然后 进行 两 两 归并 ， 得 到 | ?| 个 长 度 为 2 或 1 的 有 序 文件 ， 再 两 两 归并 ， 如 此 重复 ， 直 到 最 后 


形成 包含 个 记录 的 有 序 文件 为 止 。 这 种 反复 将 两 个 有 序 文件 归并 成 一 个 有 序 文件 的 排序 方法 
称 为 两 路 归并 排序 。 
两 路 归并 排序 的 核心 操作 是 将 一 维 数组 中 前 后 相 邻 的 两 个 有 序 序列 归并 为 一 个 有 序 序列 。 
【算法 】 将 分 别 有 序 的 data[s..m] 和 dataf[m+1..n] 归 并 为 有 序 的 data[s..n]。 


void Merge(int data[], int s, int m, int n) 
{ inti, start=s,k=0; 


int *temp; 
temp = (int *)malloc((n-s+1)*sizeof(int)); /# 辅 助 空间 #/ 
fori=mtl;s <= me&e&i<=n;++k) 翌 将 data[s..m] 与 data[m+1..n] 归 并 后 存 入 temp*/ 


if (data[s] < data[i]) temp[k] = data[s++]: 
else temp[k] = data[i++]:; 


forG s <= mi ++k) 必 将 剩余 的 data[s..m] 复 制 到 temp*/ 
temp[k] = data[st++]; 
for(; i<=n; ++k) /# 将 剩余 的 data[i.n] 复 制 到 temp#/ 


temp[k] = data[i++]; 
for(i=0; i<k: i++) 

data[start++] = temp[j]; 
free(temp); 

}/*Merge*/ 

一 趟 归并 排序 的 操作 是 :调用 [n/2n| 次 Merge 算法 ， 将 数组 datal[0..n-1] 中 前 后 相 邻 且 长 
度 为 h 的 有 序 段 进 行 两 两 归并 ,得 到 前 后 相 邻 、 长 度 为 27 的 有 序 段 ， 并 存放 在 data2[0.n-1] 中 ， 
整个 归并 排序 需 进 行 [log, n | 赵 。 归 并 排序 需要 辅助 空间 n 个 (与 待 排 记录 数量 相等 )， 时 间 复 
杂 度 为 O(nlogn) 。 

【算法 】 递 归 形 式 的 两 路 归并 。 


void MSort(int data[], int s, int t) /# 对 data[s.. 避 进行 归并 排序 */ 
{ intm; 
if(s<t) { 
m= (s+t)/2; 话 将 data[s. 划 均 分 为 data[s..m] 和 data[mt+1..t]*/ 


加 :7 医 
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MSort(data, s, m); /# 递 归 地 对 data[s..m] 进 行 归并 排序 */ 
MSort(data, m+1, D: 族 递 归 地 对 datafm+1. 匡 进行 归并 排序 */ 
Merge(data, s, m, f); 大将 data[s..m] 和 data[m+1. 避 归并 为 data[s..t]*/ 
} 
} /#MSort*/ 


【算法 】 对 一 维 数组 data[0..n-1] 中 的 元 素 进行 两 路 归并 排序 。 


void MergeSort(int data[], int n) 
{ 
MSort(data, 0, n-]): 
}/*MergeSort*/ 


3.6.7 ”基数 排序 


基数 排序 的 思想 是 按 组 成 关键 字 的 各 个 数位 的 值 进 行 排序 ， 它 是 分 配 排序 的 一 种 。 在 该 排 

序 方法 中 把 一 个 关键 字 KK; 看 成 一 个 4 元 组 ， 即 
El, KR? Re 

其 中 ，0< Kj <r， 天 1 一 m， 产 1] 一 q。 这 里 的 r 称 为 基数 。 若 关键 字 是 十 进 制 的 ， 则 天 10; 若 关 
键 字 是 八进制 的 ， 则 天 8。4 是 关键 字 的 位 数 ，qd 值 取 所 有 待 排序 的 关键 字 位 数 的 最 大 值 ， 其 他 
不 足 4 位 的 关键 字 在 前 面 补 零 。 

在 “天 ,天 ,天 ”中 ， 愉 称 为 最 高 有 效 位 ，K? 称 为 次 高 有 效 位 ， 天 ? 称 为 最 低 有 效 位 。 
基数 排序 可 以 从 最 高 有 效 位 开始 ， 也 可 以 从 最 低 有 效 位 开始 。 

基数 排序 的 基本 思想 是 : 设立 7 个 队列 ， 队 列 的 编号 分 别 为 0O、1、2、…、r-1。 首 先 按 最 
低 有 效 位 的 值 把 n 个 关键 字 分 配 到 这 + 个 队列 中 ， 然 后 按照 队列 编号 从 小 到 大 将 各 队列 中 的 关 
键 字 依次 收集 起 来 ; 接着 再 按 次 低 有 效 位 的 值 把 刚 收集 起 来 的 关键 字 分 配 到 > 个 队列 中 。 重复 上 述 
分 配 和 收集 过 程 ， 直 到 按照 最 高 有 效 位 分 配 和 收集 。 这 样 就 得 到 了 一 个 从 小 到 大 有 序 的 关键 字 
序列 。 为 了 减少 记录 移动 的 次 数 ， 队 列 可 以 采用 链 式 存储 分 配 。 每 个 链 队 列 设 两 个 指针 ， 分 别 指 
向 队 头 和 队 尾 。 

基数 排序 是 一 种 稳定 的 排序 方法 。 对 于 n 个 记录 ， 执 行 一 次 分 配 和 收集 的 时 间 为 O(n+7)。 
如 果 关键 字 有 4 位 ， 则 要 执行 4 遍 。 所 以 总 的 运算 时 间 为 O(d(n+n))。 可见 ， 对 于 不 同 的 基数 x， 
所 用 的 时 间 是 不 同 的 。 当 r 或 4 较 小 时 ， 这 种 排序 方法 较为 节省 时 间 。 另 外 ， 基 数 排序 适用 于 
链 式 分 配 的 记录 的 排序 ， 其 要 求 的 附加 存储 量 是 7 个 队列 的 头 、 尾 指针 ， 所 以 附加 存储 量 为 2 
个 存储 单元 。 由 于 竺 排序 记 录 是 以 链表 方式 存储 的 ， 相 对 于 顺序 分 配 而 言 ， 还 增加 了 n 个 指针 
域 的 空间 。 
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3.6.8 ”内 部 排序 方法 小 结 
综合 比较 所 讨论 的 各 种 排序 方法 ， 大 致 结果 如 表 3-2 所 示 。 
表 3-2 各 种 排序 方法 的 性 能 比较 


排序 方法 时 间 复 杂 度 
直接 插入 O(n’) oD) 稳定 
简单 选择 O(n) OU) 不 稳定 
冒 泡 排序 On’) 0O(1) 稳定 


希 尔 排 序 
快速 排序 
堆 排 序 
归并 排序 
基数 排序 


OU 
O(nlogn) 


O(nlogn) 
Oldlntra)) 


迄今 为 止 , 已 有 的 排序 方法 远 远 不 止 上 述 几 种 ， 人 们 之 所 以 热衷 于 研究 各 种 排序 方法 ， 不 
仅 是 由 于 排序 在 计算 机 运算 中 所 处 的 重要 位 置 ， 还 因为 不 同 的 方法 各 有 优 缺 点 ， 可 根据 需要 应 
用 到 不 同 的 场合 。 在 选取 排序 方法 时 需要 考虑 的 因素 有 待 排序 的 记录 个 数 n、 记 录 本 身 的 大 小 、 
关键 字 的 分 布 情况 、 对 排序 稳定 性 的 要 求 、 语 言 工具 的 条 件 和 辅助 空间 的 大 小 。 

依据 这 些 因素 ， 可 以 得 到 以 下 儿 点 结论 。 

(1) 车 待 排序 的 记录 数目 n 较 小 ， 可 采用 直接 插入 排序 和 简单 选择 排序 。 由 于 直接 插入 排 
序 所 需 的 记录 移动 操作 较 简 单 选择 排序 多 ， 因 而 当 记 录 本 身 信 息 量 较 大 时 ， 用 简单 选择 排序 方 

(2) 若 待 排序 记录 按 关键 字 基 本 有 序 ， 宣 采用 直接 插入 排序 或 冒 泡 排序 。 

(3) 当 n 很 大 且 关 键 字 的 位 数 较 少时 ， 采 用 链 式 基数 排序 较 好 。 

(4) 车 较 大 ， 则 应 采用 时 间 复 杂 度 为 O(nlogn) 的 排序 方法 ， 例 如 快速 排序 、 堆 排序 或 归 
并 排序 。 快速 排序 目前 被 认为 是 内 部 排序 方法 中 最 好 的 方法 , 当 待 排序 的 关键 字 为 随机 分 布 时 ， 
快速 排序 的 平均 运行 时 间 最 短 ， 但 堆 排 序 只 需 一 个 辅助 存储 空间 ， 并 且 不 会 出 现在 快速 排序 中 
可 能 出 现 的 最 坏 情况 。 这 两 种 排序 方法 都 是 不 稳定 的 排序 方法 。 若 要 求 排 序 稳定 ， 可 选择 归并 
排序 。 通 常 将 归并 排序 和 直接 插入 排序 结合 起 来 使 用 。 先 利用 直接 插入 排序 求 得 较 长 的 有 序 子 
序列 ， 然 后 再 两 两 归并 。 因 为 直接 插入 排序 是 稳定 的 ， 所 以 改进 的 归并 排序 也 是 稳定 的 。 

前 面 讨论 的 内 部 排序 算法 〈 除 基数 排序 外 ) 都 是 在 一 维 数组 上 实现 的 。 当 记录 本 身 信息 量 
较 大 时 ， 为 避免 耗费 大 量 的 时 间 移 动 记录 ， 可 以 采用 链表 作为 存储 结构 ， 在 这 种 情况 下 ， 希 尔 
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排序 、 快 速 排序 和 堆 排 序 就 不 适用 了 。 
3.6.9 ”外 部 排序 


外 部 排序 就 是 对 大 型 文件 的 排序 ， 待 排序 的 记录 存放 在 外 存 。 在 排序 的 过 程 中 ， 内 存 只 
储 文件 的 一 部 分 记录 ， 整 个 排序 过 程 需 要 进行 多 次 内 外 存 间 的 数据 交换 。 

常用 的 外 部 排序 方法 是 归并 排序 ， 一 般 分 为 两 个 阶段 : 在 第 一 阶段 ， 把 文件 中 的 记录 分 段 
读 入 内 存 ， 利 用 某 种 内 部 排序 方法 对 记录 段 进 行 排序 并 输出 到 外 存 的 另 一 个 文件 中 ， 在 新 文件 
中 形成 许多 有 序 的 记录 段 ， 称 为 归并 段 ; 在 第 二 阶段 ， 对 第 一 阶段 形成 的 归并 段 用 某 种 归并 方 
法 进行 一 赵 趟 地 归并 ， 使 文件 的 有 序 段 逐渐 加 长 ， 直 到 将 整个 文件 归并 为 一 个 有 序 段 时 为 止 。 
下 面 简单 介绍 常用 的 多 路 平衡 归并 方法 。 

大 路 平衡 归并 是 指 文件 经 外 部 排序 的 第 一 个 阶段 后 ， 已 经 形成 了 由 若干 个 初始 归并 段 构成 
的 文件 。 在 这 个 基础 上 ， 反 复 将 每 次 确定 的 天 个 归并 段 归并 为 一 个 有 序 段 ， 将 一 个 文件 上 的 记 
录 归 并 到 另 一 个 文件 上 。 重 复 这 个 过 程 ， 直 到 文件 中 的 所 有 记录 都 归并 为 一 个 有 序 段 。 

设 已 经 得 到 8 个 初始 归并 段 ， 如 图 3-58 所 示 ， 其 中 ，b; 表 示 第 i 个 归并 上段 。 


bo b 及 bs bs bs be 
4 6 28 9 1 26 3 
17 14 31 21 10 2 22 
46 55 49 47 52 38 59 


图 3-58 初始 归并 段 
在 形 渤 反 拓 序 中 ， 首 先 对 个 记录 的 关键 字 进行 两 两 比 较 ， 然 后 在 | 所 | 个 较 小 者 之 同和 


进行 两 两 比较 ， 如 此 重复 ， 直 到 选 出 最 小 关键 字 的 记录 为 止 ， 该 过 程 可 用 一 棵 有 个 叶子 结 点 
的 完全 二 又 树 表示 ， 如 图 3-59 (a) 所 示 。 其 中 ， 每 个 非 终 端 结 点 中 的 关键 字 等 于 其 左 、 右 孩 
子 结 点 中 较 小 的 关键 字 ， 则 树 根 结 点 中 的 关键 字 即 为 所 有 叶子 中 的 最 小 关键 字 。 在 输出 最 小 关 
键 字 之 后 ， 更 新 最 小 关键 字 所 在 的 叶子 结 点 数据 ， 然 后 从 该 叶子 结 点 出 发 ， 与 其 左 (兄弟 ) 结 
点 的 关键 字 进 行 比较 ， 修 改 从 叶子 结 点 到 根 的 路 径 上 各 结 点 的 关键 字 ， 则 根 结 点 的 关键 字 即 为 
次 小 关键 字 ， 如 图 3-59 (b》 所 示 。 重 复 该 过 程 ， 即 可 完成 对 所 有 记录 的 排序 。 

在 3-59 所 示 的 树 中， 每 个 非 终 端 结 点 记录 了 其 左 、 右 孩子 中 的 “优胜 者 ”所 以 称 其 为 “ 胜 
者 树 ”。 反 之 ， 若 在 双亲 结 点 中 记录 比较 后 的 失败 者 ， 而 让 胜 者 去 参加 更 上 一 层 的 比较 ， 便 可 得 
到 一 棵 “ 败 者 树 ”。 这 样 一 来 ， 当 优胜 者 到 达 父 结 点 时 ， 立 刻 就 知道 原先 在 此 比较 的 失败 者 并 与 
失败 者 进行 比较 ， 再 次 记录 新 的 失败 者 并 让 优胜 者 去 进行 更 上 一 层 的 比较 。 在 败 者 树 中 ， 每 个 结 
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点 只 需 和 其 父 结 点 进行 比较 ， 而 在 胜 者 树 中 ， 向 上 调整 时 结 点 需 和 兄弟 结 点 比较 ， 那 么 就 需 得 到 
兄弟 结 点 的 位 置信 息 ， 因 此 败 者 树 更 易于 编程 。 


(a) 树 形 选择 排序 找 出 最 小 关键 字 (b) 树 形 选 择 排序 找 出 次 小 关键 字 
图 3-59 树 形 选择 排序 


图 3-60 所 示 的 是 一 棵 实现 8 路 归并 的 败 者 树 。 


ob bs bs bs be by 


图 3-60 利用 败 者 树 找 出 8 路 归并 段 的 最 小 关键 字 


为 了 简便 起 见 ， 设 每 个 记录 为 一 个 整数 ， 败 者 树 用 数组 1s[] 表 示 ，ks 四 的 值 为 败 者 所 在 归并 
段 的 段 号 ， 令 1s[1] 是 树 根 结 点 ，ls [0] 是 ksD]〈 根 》 的 父 结 点 ，k[0] 中 存储 每 次 选 出 的 优胜 者 所 在 
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归并 段 的 段 号 ， 输 出 时 则 取 ls[0] 指 示 的 归并 段 的 当前 记录 。 例 如 ， 在 3-60 所 示 的 败 者 树 中 ， 叶 
子 结 点 的 数据 来 自 各 个 归并 段 ， 败 者 树 的 根 结 点 [1] 的 父 结 点 k[0] 中 存储 了 优胜 者 〈 最 小 记录 ) 
所 在 的 归并 段 。 图 3-61 所 示 的 是 输出 一 个 记录 后 ， 重 新 调整 后 的 败 者 树 。 


图 3-61 利用 败 者 树 找 出 8 路 归并 段 的 次 小 关键 字 
【算法 】 利 用 败 者 树 实现 天 路 平衡 归并 。 


#define K 8 

#define MINKEY -1 谍 比 所 有 关键 字 都 小 的 一 个 值 */ 
#define MAXKEY 10000 谍 比 所 有 关键 字 都 大 的 一 个 值 */ 
int b[K+1]; 


void K merge(intls[K]) 
/*ls[0]~~ls[K-1] 是 败 者 树 的 内 部 结 点 。b[0]~~b[K-1] 分 别 存储 KK 个 初始 归并 段 的 当前 记录 */ 
应 函 数 Get_nextRec(GD) 从 第 i 个 归并 段 读 取 并 返回 当前 记录 ， 若 归并 段 已 室 ， 返 回 MAXKEY */ 


{ inti, qd: 
for(i=0;i<K:;it+) 
b[i] = Get_nextRec(i); 记分 别 读 取 区 个 归并 段 的 第 一 个 关键 字 */ 
b[K] = MINKEY: 
for(i=0;i<K;++i) ls 中 =K; /人 * 创 建 败 者 树 ， 设 置 ls 中 败 者 的 初 值 */ 
for(i=K-1:i>=0; -i) 刻 依 次 从 b[K-1]、b[K-2]、*…、b[0] 出 发 调整 败 者 树 */ 
Adjust(ls, D: 


while (b[ls[0]] = MAXKEY){ /*]s[0] 记 录 本 趟 最 小 关键 字 所 在 的 段 号 */ 
q=ls[0]: /*q 是 当前 最 小 关键 字 所 在 的 归并 上段 */ 


第 3 章 数据 结构 
printf("%d", b[q]): 上 输出 最 小 关键 字 */ 
b[q] = Get nextRec(q); 
Adjust(ls, q); 让 调整 败 者 树 ， 选 择 新 的 最 小 关键 字 */ 
}/*while*/ 
}*K_ merge*/ 


【函数 】 败 者 树 的 调整 : 从 叶子 结 点 到 根 结 点 进行 调整 。 
void Adjust(int Is[K], int s) /# 败 者 树 存储 在 1s[1]~1s[K-!] 中 ，s 为 记录 所 在 的 归并 有 段 号 */ 


{ intt temp; 
t= (s+K)/2; /*t 为 b[s] 的 父 结 点 在 败 者 树 中 的 下 标 ，K 是 归并 段 数 */ 
while (t> 0) { /# 若 没有 到 达 树 根 ， 则 继续 所 
f(b[s] > blls[rt]) { /# 与 父 结 点 指示 的 数据 进行 比较 所 
temp = s; s = 1s[{t]; /*s 指示 胜 者 ， 胜 者 将 去 参加 更 上 一 层 的 比较 */ 
ls[{t] = temp: /*ls 轧 记录 败 者 所 在 的 段 号 */ 
Jifr/ 
t=1/2; 证 向 树 根 回 退 一 层 */ 
}/*while*/ 
ls[0] = s; /x*]s[0] 记 录 本 趟 最 小 关键 字 所 在 的 段 号 */ 


}/*Adjust*/ 
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4.1 操作 系统 概述 


计算 机 软件 通常 分 为 系统 软件 和 应 用 软件 两 大 类 。 系 统 软件 是 计算 机 系统 的 一 部 分 ， 用 来 
支持 应 用 软件 的 运行 。 应 用 软件 是 指 计算 机 用 户 利用 计算 机 的 软件 、 硬 件 资源 为 某 一 专门 的 应 
用 目的 而 开发 的 软件 。 例 如 ， 科 学 计算 、 工 程 设计 、 数 据 处 理 、 事 务 处 理 和 过 程控 制 等 方面 的 
程序 ， 以 及 文字 处 理 软件 、 表 格 处 理 软件 、 辅 助 设计 软件 《CAD ) 和 实时 处 理 软件 等 。 常 用 的 
系统 软件 有 操作 系统 、 语 言 处 理 程序 、 链 接 程序 、 诊 断 程序 和 数据 库 管理 系统 等 。 操 作 系统 是 
计算 机 系统 中 必 不 可 少 的 核心 系统 软件 ， 其 他 软件 是 建立 在 操作 系统 的 基础 上 ， 并 在 操作 系统 
的 统一 管理 和 支持 下 运行 的 ， 是 用 户 与 计算 机 之 间 的 接口 。 


4.1.1 操作 系统 的 基本 概念 


1. 操作 系统 定义 及 作用 


传统 计算 机 系统 资源 分 为 硬件 资源 和 软件 资源 。 硬 件 资源 包括 中 央 处 理 机 、 存 储 器 和 输 
入 /输出 设备 等 物理 设备 ; 软件 资源 是 以 文件 形式 保存 在 存储 器 上 的 程序 和 数据 等 信息 。 现代 计 
算 机 系统 资源 管理 范围 已 经 扩展 到 感知 、 能 源 、 通 信 资 源 和 服务 资源 。 本 教材 主要 介绍 传统 计 
算 机 系统 资源 管理 。 

操作 系统 定义 : 能 有 效 地 组 织 和 管理 系统 中 的 各 种 软 /硬件 资源 ， 合 理 地 组 织 计 算 机 系统 工 
作 流 程 ， 控 制程 序 的 执行 ， 并 且 向 用 户 提供 一 个 良好 的 工作 环境 和 友好 的 接口 。 

操作 系统 有 两 个 重要 的 作用 : 第 一 ， 通 过 资源 管理 提高 计算 机 系统 的 效率 ; 第 二 ， 改 善人 
机 界面 向 用 户 提供 友好 的 工作 环境 。 

操作 系统 是 计算 机 系统 的 资源 管理 者 , 它 含 有 对 系统 软 /硬件 资源 实施 管理 的 一 组 程序 。 其 
首要 作用 就 是 通过 CPU 管理 、 存 储 管理 、 设 备 管理 和 文件 管理 对 各 种 资源 进行 合理 的 分 配 ， 改 
善 资源 的 共享 和 利用 程度 ， 最 大 限度 地 发 挥 计 算 机 系统 的 工作 效率 ， 提 高 计算 机 系统 在 单位 时 
间 内 处 理工 作 的 能 力 〈 称 为 系统 的 “吞吐 量 (throughput)”)。 

大 家 知道 ， 没 有 安装 操作 系统 的 计算 机 ， 用 户 将 要 面 对 的 是 0、1 代码 和 一 些 难 懂 的 机 器 
指令 ， 通 过 按钮 或 按键 来 操作 计算 机 ， 这 样 既 笨 拙 又 费时 。 一 旦 安装 操作 系统 后 ， 用 户 面 对 的 
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不 再 是 笨拙 的 裸 机 ， 而 是 操作 便利 、 服 务 周 到 的 操作 系统 ， 从 而 明显 地 改善 了 用 户 界面 ， 提 高 
了 用 户 的 工作 效率 。 


2. 操作 系统 特征 与 功能 


操作 系统 的 4 个 特征 是 并 发 性 、 共 享 性 、 虚 拟 性 和 不 确定 性 。 从 传统 的 计算 机 资源 管理 的 
观点 来 看 ， 操 作 系统 的 功能 可 分 为 处 理 机 管理 、 文 件 管理 、 存 储 管理 、 设 备 管理 和 作业 管理 5 
大 部 分 。 操 作 系统 的 5 大 部 分 通过 相互 配合 、 协 调 工作 来 实现 对 计算 机 系统 中 资源 的 管理 ， 控 
制 任务 的 运行 。 

(1) 进程 管理 。 实 质 上 是 对 处 理 机 的 执行 “时 间 ” 进 行 管理 ， 采 用 多 道 程序 等 技术 将 CPU 
的 时 间 合理 地 分 配给 每 个 任务 ， 主 要 包括 进程 控制 、 进 程 同 步 、 进 程 通 信和 进程 调度 。 

(2) 文件 管理 。 主 要 包括 文件 存储 空间 管理 、 目 录 管 理 、 文 件 的 读 / 写 管理 和 存 取 控制 。 

(3) 存储 管理 。 存 储 管理 是 对 主 存储 器 “空间 ”进行 管理 ， 主 要 包括 存储 分 配 与 回收 、 存 
储 保护 、 地 址 映射 (变换 ) 和 主 存 扩充 。 

(4) 设备 管理 。 实 质 是 对 硬件 设备 的 管理 ， 包 括 对 输入 /输出 设备 的 分 配 、 启 动 、 完 成 和 
回收 。 

(5) 作业 管理 。 包 括 任 务 、 界 面 管理 、 人 机 交互 、 图 形 界面 、 语 音 控制 和 虚拟 现实 等 。 

操作 系统 提供 系统 命令 一 级 的 接口 ， 供 用 户 用 于 组 织 和 控制 自己 的 作业 运行 ， 如 命令 行 、 
菜单 式 或 GUI“ 联 机” 命令 脚本 “ 脱 机 ”。 操 作 系统 还 提供 编程 一 级 接口 ， 供 用 户 程序 和 系统 
程序 调用 操作 系统 功能 ， 如 系统 调用 和 高 级 语言 库 函数 。 


4.1.2 ”操作 系统 分 类 及 特点 


通常 ， 操 作 系统 可 分 为 批 处 理 操作 系统 、 分 时 操作 系统 、 实 时 操作 系统 、 网 络 操作 系统 、 
分 布 式 操作 系统 、 微 型 计算 机 操作 系统 和 人 嵌入 式 操作 系统 等 类 型 。 


1. 批 处 理 操作 系统 


批 处 理 操作 系统 分 为 单 道 批 处 理 和 多 道 批 处 理 。 

单 道 批 处 理 操作 系统 是 一 种 早期 的 操作 系统 ， 该 系统 可 以 提交 多 个 作业 ,“ 单 道 ” 的 含义 
是 指 一 次 只 有 一 个 作业 装 入 内 存 执行 。 作 业 由 用 户 程 序 、 数 据 和 作业 说 明 书 〈 作 业 控 制 语言 ) 
3 个 部 分 组 成 。 当 一 个 作业 运行 结束 后 ， 随 即 自动 调 入 同 批 的 下 一 个 作业 ， 从 而 节省 了 作业 之 
间 的 人 工 干预 时 间 ， 提 高 了 资源 的 利用 率 。 

多 道 批 处 理 操作 系统 允许 多 个 作业 装 入 内 存 执行 ,在 任意 一 个 时 刻 ， 作 业 都 处 于 开始 点 和 
终止 点 之 间 。 每 当 运行 中 的 一 个 作业 由 于 输入 /输出 操作 需要 调用 外 部 设备 时 ， 就 把 CPU 交 给 
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另 一 个 等 待 运行 的 作业 ， 从 而 将 主机 与 外 部 设备 的 工作 由 串 行 改变 为 并 行 ， 进 一 步 避 免 了 因 主 
机 等 待 外 设 完 成 任务 而 浪费 宝贵 的 CPU 时 间 。 多 道 批 处 理 系统 主要 有 3 个 特点 : 多 道 、 宏 观 上 
并 行 运行 、 微 观 上 串 行 运行 。 

2. 分 时 操作 系统 


在 分 时 操作 系统 中 ， 一 个 计算 机 系统 与 多 个 终端 设备 连接 。 分 时 操作 系统 是 将 CPU 的 工 
作 时 间 划 分 为 许多 很 短 的 时 间 片 ， 轮 流 为 各 个 终端 的 用 户 服务 。 例 如 ， 一 个 带 20 个 终端 的 分 时 
系统 , 若 每 个 用 户 每 次 分 配 一 个 50ms 的 时 间 片 ， 则 每 隔 1s 即 可 为 所 有 的 用 户 服务 一 遍 。 因 此 ， 
尽管 各 个 终端 上 的 作业 是 断 续 地 运行 的 ， 但 由 于 操作 系统 每 次 对 用 户 程序 都 能 做 出 及 时 的 响 
应 ， 因 此 用 户 感觉 整个 系统 均 归 其 一 人 占用 。 

分 时 系统 主要 有 4 个 特点 : 多 路 性 、 独 立 性 、 交 互 性 和 及 时 性 。 


3. 实时 操作 系统 


实时 是 指 计算 机 对 于 外 来 信息 能 够 以 足够 快 的 速度 进行 处 理 ， 并 在 被 控 对 象 允许 的 时 间 范 
围 内 做 出 快速 反应 。 实 时 系统 对 交互 能 力 要 求 不 高 ， 但 要 求 可 靠 性 有 保障 。 为 了 提高 系统 的 响 
应 时 间 ， 对 随机 发 生 的 外 部 事件 应 及 时 做 出 响应 并 对 其 进行 处 理 。 

实时 系统 分 为 实时 控制 系统 和 实时 信息 处 理 系统 。 实 时 控制 系统 主要 用 于 生产 过 程 的 自动 
控制 ， 例 如 数据 自动 采集 、 武 器 控制 、 火 炮 自动 控制 、 飞 机 自动 驾驶 和 导弹 的 制导 系统 等 。 实 
时 信息 处 理 系统 主要 用 于 实时 信息 处 理 ， 例 如 飞机 订 票 系统 、 情 报 检索 系统 等 。 实 时 系统 与 分 
时 系统 除了 应 用 的 环境 不 同 ， 主 要 有 以 下 三 点 区 别 。 

(1) 系统 的 设计 目标 不 同 。 分 时 系统 是 设计 成 一 个 多 用 户 的 通用 系统 ， 交 互 能 力 强 ， 而 实 
时 系统 大 多 是 专用 系统 。 

(2) 交互 性 的 强 弱 不 同 。 分 时 系统 是 多 用 户 的 通用 系统 ， 交 互 能 力 强 ; 而 实时 系统 是 专用 
系统 ， 仅 允许 操作 并 访问 有 限 的 专用 程序 ， 不 能 随便 修改 ， 且 交互 能 力 差 。 

(3) 响应 时 间 的 敏感 程度 不 同 。 分 时 系统 是 以 用 户 能 接收 的 等 待 时 间 为 系统 的 设计 依据 ， 
而 实时 系统 是 以 被 测 物体 所 能 接受 的 延迟 为 系统 设计 依据 。 因 此 ， 实 时 系统 对 响应 时 间 的 敏感 
程度 更 强 。 


4. 网 络 操作 系统 


网 络 操作 系统 是 使 联网 计算 机 能 方便 而 有 效 地 共享 网 络 资源 ,为 网 络 用 户 提供 各 种 服务 的 
软件 和 有 关 协 议 的 集合 。 因 此 ， 网 络 操作 系统 的 功能 主要 包括 高 效 、 可 靠 的 网 络 通信 ; 对 网 络 
中 共享 资源 (在 LAN 中 有 硬盘 、 打 印 机 等 ) 的 有 效 管理 ， 提 供电 子 邮 件 、 文 件 传输 、 共 享 硬 
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盘 和 打印 机 等 服务 ， 网络 安全 管理 ， 提 供 互 操作 能 力 。 

计算 机 网 络 系统 除了 硬件 外 ， 还 需要 有 系统 软件 ， 二 者 结合 构成 计算 机 网 络 的 基础 平台 。 
操作 系统 是 最 重要 的 系统 软件 。 网 络 操作 系统 是 网 络 用 户 和 计算 机 网 络 之 间 的 一 个 接口 ， 它 除 
了 应 具备 通常 操作 系统 应 具备 的 基本 功能 外 ， 还 应 有 联网 功能 ， 支 持 网 络 体系 结构 和 各 种 网 络 
通信 协议 ， 提 供 网 络 互 联 功能 ， 支 持 有 效 、 可 靠 安全 的 数据 传送 。 

一 个 典型 的 网 络 操作 系统 的 特征 包括 硬件 独立 性 、 多 用 户 支 持 等 。 其 中 ， 硬 件 独立 性 是 指 
网 络 操作 系统 可 以 运行 在 不 同 的 网 络 硬件 上 ， 可 以 通过 网 桥 或 路 由 器 与 别 的 网 络 连接 ;多 用 户 
支持 ， 应 能 同时 支持 多 个 用 户 对 网 络 的 访问 ， 应 对 信息 资源 提供 完全 的 安全 和 保护 功能 ; 支持 
网 络 实用 程序 及 其 管理 功能 ， 如 系统 备份 、 安 全 管理 、 容 错 和 性 能 控制 ， 多 种 客户 端 支持 ， 如 
Windows NT 网 络 操作 系统 包括 OS/2、Windows 98 和 UNIX 等 多 种 客户 端 ， 极 大 地 方便 了 网 络 
用 户 ; 提供 目录 服务 ， 以 单一 逻辑 的 方式 让 用 户 访 问 位 于 世界 范围 内 的 所 有 网 络 服 务 和 资源 的 
技术 ; 支持 多 种 增值 服务 ， 如 文件 服务 、 打 印 服 务 、 通 信服 务 和 数据 库 服 务 等 。 

网 络 操作 系统 可 分 为 如 下 三 类 。 

(1) 集中 模式 。 集 中 式 网 络 操作 系统 是 由 分 时 操作 系统 加 上 网 络 功能 演变 而 来 的 ， 系 统 的 
基本 单元 由 一 台 主 机 和 若干 台 与 主机 相连 的 终端 构成 ， 将 多 台 主 机 连接 起 来 形成 了 网 络 ， 信 息 
的 处 理 和 控制 是 集中 的 。UNIX 就 是 这 类 系统 的 典型 例子 。 

(2) 客户 端 /服务 器 模式 。 这 是 流行 的 网 络 工 作 模式 , 该 种 模式 网 络 可 分 为 服务 器 和 客户 端 。 
服务 器 是 网 络 的 控制 中 心 ， 其 任务 是 向 客户 端 提供 一 种 或 多 种 服务 ， 服 务 器 可 有 多 种 类 型 ， 如 
提供 文件 /打印 服务 的 文件 服务 器 等 。 客 户 端 是 用 于 本 地 处 理 和 访问 服务 器 的 站 点 ， 在 客户 端 中 
包含 了 本 地 处 理 软件 和 访问 服务 器 上 服务 程序 的 软件 接口 。 

(3) 对 等 模式 (Peer-to-Peer) 模式 。 在 采用 这 种 模式 的 操作 系统 网 络 中 ， 各 个 站 点 是 对 等 
的 。 它 既 可 作为 客户 端 去 访问 其 他 站 点 ， 又 可 作为 服务 器 向 其 他 站 点 提供 服务 ， 在 网 络 中 既 无 
服务 处 理 中 心 ， 也 无 控制 中 心 ， 或 者 说 ， 网 络 的 服务 和 控制 功能 分 布 在 各 个 站 点 上 。 可 见 ， 该 
模式 具有 分 布 处 理 及 分 布控 制 的 特征 。 

现代 操作 系统 已 把 网 络 功能 包含 到 操作 系统 的 内 核 中 ,作为 操作 系统 核心 功能 的 一 个 组 成 
部 分 。Microsoft 公司 的 Windows NT、AT & TI 公司 的 UNIX SystemV、Sun 公司 的 SunOS、HP 
公司 的 HP/OX、IBM 公司 的 AIX 和 Linux 等 都 已 把 TCP/IP 网 络 功能 包含 在 内 核 中 。 

网 络 操作 系统 是 整个 网 络 的 灵魂 ， 它 决定 了 网 络 的 功能 ， 并 由 此 决定 了 不 同 网 络 的 应 用 领 
域 及 方向 。 目 前 ， 网 络 操作 系统 主要 有 三 大 阵营 : UNIX、Windows NT 和 NetWare。 各 种 网 络 
操作 系统 具有 不 同 的 特点 ， 随 着 网 络 技术 的 发 展 ， 新 的 网 络 操作 系统 还 会 不 断 出现 ， 用 户 可 根 
据 自 己 的 需要 进行 选择 ， 而 不 要 仅 局 限于 其 技术 水 平 的 高 低 。 
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5. 分 布 式 操作 系统 


分 布 式 计算 机 系统 是 由 多 个 分 散 的 计算 机 经 连接 而 成 的 计算 机 系统 ， 系 统 中 的 计算 机 无 
主 、 次 之 分 ， 任 意 两 台 计算 机 可 以 通过 通信 交换 信息 。 通 常 ， 为 分 布 式 计算 机 系统 配置 的 操作 
系统 称 为 分 布 式 操作 系统 。 

分 布 式 操作 系统 能 直接 对 系统 中 的 各 类 资源 进行 动态 分 配 和 调度 、 任 务 划分 、 信 息 传输 协 
调 工作 ， 并 为 用 户 提供 一 个 统一 的 界面 、 标 准 的 接口 ， 用 户 通过 这 一 界面 实现 所 需要 的 操作 和 
使 用 系统 资源 ， 使 系统 中 若干 台 计算 机 相互 协作 完成 共同 的 任务 ， 有 效 地 控制 和 协调 诸 任务 的 
并 行 执 行 ， 并 向 系统 提供 统一 、 有 效 的 接口 的 软件 集合 。 

分 布 式 操作 系统 是 网 络 操作 系统 的 更 高 级 形式 ， 它 保持 网 络 系统 所 拥有 的 全 部 功能 ， 同 时 
又 有 透明 性 、 可 靠 性 和 高 性 能 等 特性 。 


6 微型 计算 机 操作 系统 


微型 计算 机 操作 系统 简称 微机 操作 系统 ， 常 用 的 有 Windows、Mac OS、Linux。Windows 
操作 系统 是 Microsoft 公司 开发 的 图 形 用 户 界面 、 多 任务 、 多 线程 操作 系统 。Mac OS 操作 系统 
是 美国 苹果 计算 机 公司 为 它 的 Macintosh 计算 机 设计 的 操作 系统 的 一 代 操 作 系 统 ， 该 机 型 于 
1984 年 推出 ， 率 先 采用 了 一 些 我 们 至 今 仍 为 人 称道 的 技术 ， 如 GUI 图 形 用 户 界面 、 多 媒体 应 
用 、 鼠 标 等 。Linux 是 一 套 免费 使 用 并 可 自由 传播 的 类 UNIX 操作 系统 ， 由 世界 各 地 成 千 上 万 
的 程序 员 设 计 和 实现 ， 其 目的 是 建立 不 受 任何 商品 化 软件 版 权 制 约 的 、 全 世界 都 能 自由 使 用 的 
UNIX 兼容 产品 。 


7. 翌 入 式 操作 系统 


媒 入 式 操作 系统 运行 在 嵌入 式 智 能 芯片 环境 中 ， 对 整个 智能 芯片 以 及 它 所 操作 、 控 制 的 各 
种 部 件 装置 等 资源 进行 统一 协调 、 处 理 、 指 挥 和 控制 。 其 主要 特点 如 下 

(1) 微型 化 。 从 性 能 和 成 本 角度 考虑 ， 希 望 占用 的 资源 和 系统 代码 量 少 ， 如 内 存 少 、 字 长 
短 、 运 行 速度 有 限 、 能 源 少 〈 用 微小 型 电池 )。 

(2) 可 定制 。 从 减少 成 本 和 缩短 研发 周期 考虑 ， 要 求 嵌 入 式 操作 系统 能 运行 在 不 同 的 微 处 
理 器 平台 上 ， 能 针对 硬件 变化 进行 结构 与 功能 上 的 配置 ， 以 满足 不 同 应 用 需要 。 

(3) 实时 性 。 人 嵌入 式 操作 系统 主要 应 用 于 过 程控 制 、 数 据 采 集 、 传 输 通 信 、 多 媒体 信息 及 
关键 要 害 领域 需要 迅速 响应 的 场合 ， 所 以 对 实时 性 要 求 较 高 。 

(4) 可 靠 性 。 系 统 构件 、 模 块 和 体系 结构 必须 达到 应 有 的 可 靠 性 ， 对 关键 要 害 应 用 还 要 提 
供 容错 和 防 故 障 措施 。 
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(5) 易 移植 性 .为 了 提高 系统 的 易 移植 性 ,通常 采用 硬件 抽象 层 (Hardware Abstraction Level， 
HAL) 和 板 级 支撑 包 〈Board Support Package，BSP) 的 底层 设计 技术 。 

人 嵌入 式 实时 操作 系统 有 很 多 , 常见 的 有 VxWorks、hClinux、PalmnOS、WindowsCE 、hC/OS-I 
和 eCos 等 。 


4.1.3 ”操作 系统 的 发 展 


操作 系统 是 在 人 们 不 断 地 改善 计算 机 系统 性 能 和 提高 资源 利用 率 的 过 程 中 逐步 地 形成 和 
发 展 起 来 的 。 推 动 操作 系统 发 展 的 主要 动力 是 “需求 推动 发 展 ”。 回 顾 计算 机 的 发 展 历史 ， 用 
户 就 会 发 现 操作 系统 的 重大 改进 与 计算 机 硬件 的 更 新 换代 相 吻 合 。 因 此 ， 计 算 机 各 代 的 划分 主 
要 是 以 硬件 和 操作 系统 软件 技术 的 创新 为 标志 。 每 当 对 操作 系统 做 出 新 的 关键 性 需求 分 析 时 ， 
这 些 新 的 需求 有 些 必须 得 到 计算 机 系统 的 硬件 支持 。 任 何事 物 都 是 在 不 断 解决 问题 的 过 程 中 向 
前 发 展 的 ， 作 为 新 一 代 计 算 机 系统 除了 要 继承 上 一 代 的 全 部 优点 外 ， 更 重要 的 是 克服 上 一 代 存 
在 的 问题 和 不 足 ， 与 此 同时 ， 新 的 设计 理论 和 技术 又 会 产生 许多 新 的 有 待 解决 的 问题 。 

促使 操作 系统 发 展 的 因素 主要 有 3 个 方面 : 第 一 ， 硬 件 的 不 断 升 级 与 新 的 硬件 产品 出 现 ， 
需要 操作 系统 提供 更 多 、 更 复杂 的 支持 ;第 二 ， 新 的 服务 需求 ， 操 作 系统 为 了 满足 系统 管理 者 
和 用 户 需 求 ， 需 要 不 断 扩大 服务 范围 ， 第 三 ， 修 补 操作 系统 自身 的 错误 ， 操 作 系 统 在 运行 的 过 
程 中 其 自身 的 错误 也 会 不 断 地 被 发 现 , 因此 需要 不 断 地 修补 操作 系统 自身 的 错误 ( 即 所 谓 的 “ 补 
J ”)。 需 要 说 明 的 是 ， 在 修补 的 过 程 中 也 可 能 会 产生 新 的 错误 。 


4.2 进程 管理 


进程 管理 也 称 处 理 机 管理 。 在 多 道 程序 批 处 理 系统 和 分 时 系统 中 有 多 个 并 发 执行 的 程序 ， 
为 了 描述 系统 中 程序 执行 时 动态 变化 的 过 程 引入 了 进程 。 进 程 是 资源 分 配 和 独立 运行 的 基本 单 
位 。 进 程 管理 重点 需要 研究 诸 进 程 之 间 的 并 发 特性 ， 以 及 进程 之 间 相互 合作 与 资源 竞争 产生 的 
问题 。 
4.2.1 基本 概念 

1， 程序 与 进程 


1) 程序 顺序 执行 的 特征 

前 趋 图 是 一 个 有 向 无 循环 图 ， 由 结 点 和 有 向 边 组 成 ， 结 点 代表 各 程序 段 的 操作 ， 而 结 点 间 
的 有 向 边 表 示 两 个 程序 段 操作 之 间 存 在 的 前 趋 关系 〈 一 )。 程 序 段 Pi 和 Pj 的 前 趋 关 系 表示 成 
Pi 一 Pj， 其 中 ，Pi 是 Pj 的 前 趋 ，Pj 是 Pi 的 后 继 ， 其 含义 是 Pi 执行 结束 后 Pj 才能 执行 。 例 如 ， 


国医 


国 186 若 。 软 人 设计 师 教程 (第 5 版) 


图 4-1 为 3 个 程序 段 ， 其 中 输入 是 计算 的 前 驱 〈 计 算是 输入 的 后 继 )， 输 入 结束 才能 进行 计算 ; 
计算 是 输出 的 前 驱 ， 计 算 结束 才能 进行 输出 。 

程序 顺序 执行 时 的 主要 特征 包括 顺序 性 、 封 闭 性 和 可 再 现 性 。 

2) 程序 并 发 执行 的 特征 

若 在 计算 机 系统 中 采用 多 道 程序 设计 技术 ， 则 主 存 中 的 多 道 程序 可 处 于 并 发 执行 状态 。 对 
于 上 述 有 3 个 程序 段 的 作业 类 ， 虽 然 每 个 作业 有 前 趋 关 系 的 各 程序 段 不 能 在 CPU 和 输入 /输出 
各 部 件 并 行 执行 ， 但 是 同一 个 作业 内 没有 前 趋 关 系 的 程序 段 或 不 同 作业 的 程序 段 可 以 分 别 在 
CPU 和 各 输入 /输出 部 件 上 并 行 执行 。 例 如 ， 某 系统 中 有 一 个 CPU、 一 台 输 入 设备 和 一 台 输 出 
设备 ,每 个 作业 具有 3 个 程序 段 输入 ,计算 C; 和 输出 PX( 二 1,2,3)。 图 4-2 为 3 个 作业 的 各 程序 
段 并 发 执行 的 前 驱 图 。 

从 图 4-2 中 可 以 看 出 , 荆 与 Ci 并 行 执行 ， 、C; 与 Pi 并 行 执行 ， C3 与 P 并 行 执 行 。 其 中 ， 
ED、 受到 工 的 间接 制约 ，Cz、Cs 受到 Ci 的 间接 制约 ，P,、P; 受到 Pi 的 间接 制约 ， 而 C1、P， 
受到 了 的 直接 制约 ， 等 等 。 


图 4-1 3 个 结 点 的 前 驱 图 图 4-2 ”程序 并 发 执行 的 前 驱 图 
程序 并 发 执行 时 的 特征 如 下 。 
(1) 失去 了 程序 的 封闭 性 。 
(2) 程序 和 机 器 的 执行 程序 的 活动 不 再 一 一 对 应 。 
(3) 并 发 程序 间 的 相互 制约 性 。 
例如 ， 两 个 并 发 执行 的 程序 段 完 成 交通 流量 的 统计 ， 其 中 ,“ 观 察 者 ”Pi 识别 通过 的 车 辆 
数 ,“ 报 告 者 ”P 定时 将 观察 者 的 计数 值 清 0。 程 序 实现 如 下 。 
P P; 


1 
L1: 这 有 车 通过 then L2: PRINT COUNT: 
COUNT:=COUNT+1; COUNT:=0; 
GOTOL!1; GOTO L2: 


对 于 上 例 ， 由 于 程序 可 并 发 执行 ， 所 以 可 能 有 以 下 3 种 执行 序列 。 
@® COUNT:=COUNT+1; PRINT COUNT: COUNT:.=0 
© PRINT COUNT; COUNT.=0; COUNT:=COUNT+1 
@ PRINT COUNT; COUNT=COUNT+1; COUNT:=0 
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假定 COUNT 的 某 个 循环 的 初 值 为 x»， 那 么 这 3 种 执行 序列 得 到 的 COUNT 结果 不 同 ， 如 
表 4-1 所 示 。 


表 4-1 程序 并 发 执行 的 结果 


执行 序列 © @ @ 
COUNT 打印 的 值 nt+l n | n 
COUNT 执行 后 的 值 0 1 0 


这 种 不 正确 结果 的 发 生 是 因为 两 个 程序 P 和 P, 共享 变 量 COUNT 引起 的 ， 即 程序 并 发 执 
行 破坏 了 程序 的 封闭 性 和 可 再 现 性 ， 使 得 程序 和 执行 程序 的 活动 不 再 一 一 对 应 。 为 了 解决 这 一 
问题 ， 需 要 研究 进程 间 的 同步 与 互 斥 问题 。 


2. 进程 的 组 成 


进程 是 程序 的 一 次 执行 ， 该 程序 可 以 和 其 他 程序 并 发 执行 。 进 程 通常 是 由 程序 、 数 
据 和 进程 控制 块 (Process Control Block，PCB) 组 成 的 。 
(1) PCB。PCB 是 进程 存在 的 唯一 标志 ， 其 主要 内 容 如 表 4-2 所 示 。 


表 4-2 PCB 的 内 容 
含 义 

标明 系统 中 的 各 个 进程 
说 明 进 程 当前 的 状态 
指明 程序 及 数据 在 主 存 或 外 存 的 物理 位 置 
2 4 参数 、 信 号 量 、 消 息 等 
队列 指针 链接 同一 状态 的 进程 
优先 级 进程 调度 的 依据 
现场 保护 区 将 处 理 机 的 现场 保护 到 该 区 域 ， 以 便 再 次 调度 时 能 继续 正确 运行 
其 他 因 不 同 的 系统 而 异 


息 


(2) 程序 。 程 序 部 分 描述 了 进程 需要 完成 的 功能 。 假 如 一 个 程序 能 被 多 个 进程 同时 共 
享 执行 ， 那么 这 一 部 分 就 应 该 以 可 再 入 ( 纯 ) 码 的 形式 编制 ， 它 是 程序 执行 时 不 可 修 
改 的 部 分 。 

(3) 数据 。 数据 部 分 包括 程序 执行 时 所 需 的 数据 及 工作 区 。 该 部 分 只 能 为 一 个 进程 所 专用 ， 
是 进程 的 可 修改 部 分 。 

3. 进程 的 状态 及 其 状态 间 的 切换 


1) 三 态 模 型 
在 多 道 程序 系统 中 ， 进 程 在 处 理 器 上 交替 运行 ， 状 态 也 不 断 地 发 生变 化 ， 因 此 进程 一 般 有 
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3 种 基本 状态 : 运行 、 就 绪 和 阻塞 。 图 4-3 显示 了 进程 基本 状态 及 其 转换 ， 也 称 三 态 模型 。 

(1) 运行 。 当 一 个 进程 在 处 理 机 上 运行 时 ， 则 称 该 进程 处 于 运行 状态 。 显 然 ， 对 于 单 处 理 
机 系统 ， 处 于 运行 状态 的 进程 只 有 一 个 。 

(2) 就 绪 。 一 个 进程 获得 了 除 处 理 机 外 的 一 切 所 需 资源 ， 一 旦 得 到 处 理 机 即 可 运行 ， 则 称 
此 进程 处 于 就 绪 状态 。 

(3) 阻塞 。 阻 塞 也 称 等 待 或 睡眠 状态 ， 一 个 进程 正在 等 待 某 一 事件 发 生 〈 例 如 请 求 IO 等 
待 IO 完成 等 ) 而 暂时 停止 运行 ， 这 时 即使 把 处 理 机 分 配给 进程 也 无 法 运行 ， 故 称 该 进程 处 于 
阻塞 状态 。 

2) 五 态 模 型 

事实 上 ， 对 于 一 个 实际 的 系统 ， 进 程 的 状态 及 其 转换 更 复杂 。 例 如 ， 引 入 新 建 态 和 终止 态 
构成 了 进程 的 五 态 模型 ， 如 图 4-4 所 示 。 


图 4-3 ”进程 的 三 态 模型 图 4-4 ”进程 的 五 态 模型 


其 中 ， 新 建 态 对 应 于 进程 刚刚 被 创建 时 没有 被 提交 的 状态 ， 并 等 待 系统 完成 创建 进程 的 所 有 必 
要 信息 。 因 为 创建 进程 时 分 为 两 个 阶段 ， 第 一 个 阶段 为 一 个 新 进程 创建 必要 的 管理 信息 ， 第 二 
个 阶段 让 该 进程 进入 就 绪 状 态 。 由 于 有 了 新 建 态 操作 系统 ， 往 往 可 以 根据 系统 的 性 能 和 主 存 容 
量 的 限制 推迟 新 建 态 进程 的 提交 。 

类 似 地 ， 进 程 的 终止 也 可 分 为 两 个 阶段 ， 第 一 个 阶段 等 待 操作 系统 进行 善后 处 理 ， 第 二 个 
阶段 释放 主 存 。 

3) 具有 挂 起 状态 的 进程 状态 及 其 转换 

由 于 进程 的 不 断 创 建 ， 系 统 资源 特别 是 主 存 资源 已 不 能 满足 进程 运行 的 要 求 。 这 时 ， 就 必 
须 将 某 些 进程 挂 起 ， 放 到 磁盘 对 换 区 ， 和 暂时 不 参加 调度 ， 以 平衡 系统 负载 。 或 者 是 系统 出 现 故 
障 ， 或 者 是 用 户 调试 程序 ， 也 可 能 需要 将 进程 挂 起 检查 问题 。 图 4-5 是 具有 挂 起 状态 的 进程 状 
态 及 其 转换 。 

(1) 活跃 就 绪 。 活 跃 就 绪 是 指 进程 在 主 存 并 且 可 被 调度 的 状态 。 
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(2) 静止 就 结 。 静止 就 绪 是 指 就 绪 进 程 被 对 换 到 辅 存 时 的 状态 ， 它 是 不 能 被 直接 调度 的 状 
态 ， 只 有 当主 存 中 没有 活跃 就 绪 态 进程 ， 或 者 是 挂 
起 态 进程 具有 更 高 的 优先 级 时 ， 系 统 将 把 挂 起 就 绪 
态 进 程 调 回 主 存 并 转换 为 活跃 就 绪 。 

(3) 活跃 阻塞 。 活 跃 阻塞 是 指 进程 在 主 存 ， 一 
旦 等 待 的 事件 产生 便 进入 活跃 就 绪 状 态 。 

(4) 静止 阻塞 。 静止 阻塞 是 指 阻塞 进程 对 换 到 
辅 存 时 的 状态 ， 一 旦 等 待 的 事件 产生 便 进 入 静止 就 
绪 状态 。 


4.2.2 ”进程 的 控制 


进程 控制 就 是 对 系统 中 的 所 有 进程 从 创建 到 消 
亡 的 全 过 程 实施 有 效 的 控制 。 为 此 ， 操 作 系统 设置 了 一 套 控制 机 构 ， 该 机 构 的 主要 功能 包括 创 
建 一 个 新 进程 ， 撤 销 一 个 已 经 运行 完 的 进程 ， 改 变 进 程 的 状态 ， 实 现 进程 间 的 通信 。 进 程控 制 
是 由 操作 系统 内 核 (Kermel) 中 的 原 语 实现 的 。 内 核 是 计算 机 系统 硬件 的 首次 延伸 ， 是 基于 硬 
件 的 第 一 层 软件 扩充 ， 它 为 系统 对 进程 进行 控制 和 管理 提供 了 良好 的 环境 。 

原 语 Primitive) 是 指 由 若干 条 机 器 指令 组 成 的 ， 用 于 完成 特定 功能 的 程序 段 。 原 语 的 特 
点 是 在 执行 时 不 能 被 分 割 ， 即 原子 操作 要 么 都 做 ， 要 么 都 不 做 。 内 核 中 所 包含 的 原 语 主要 有 进 
程控 制 原 语 、 进 程 通信 原 语 、 资 源 管理 原 语 以 及 其 他 方面 的 原 语 。 属 于 进程 控制 方面 的 原 语 有 
进程 创建 原 语 、 进 程 撤销 原 语 、 进 程 挂 起 原 语 、 进 程 激活 原 语 、 进 程 阻塞 原 语 以 及 进程 唤醒 原 
语 等。 不 同 的 操作 系统 内 核 所 包含 的 功能 不 同 ， 但 大 多 数 操作 系统 的 内 核 都 包含 支撑 功能 和 资 
源 管理 的 功能 。 
4.2.3 ”进程 间 的 通信 

在 多 道 程序 环境 的 系统 中 存在 多 个 可 以 并 发 执行 的 进程 ， 故 进程 间 必然 存在 资源 共享 和 相互 
合作 的 问题 。 进 程 通信 是 指 各 个 进程 交换 信息 的 过 程 。 

1. 同步 与 互 斥 

同步 是 合作 进程 间 的 直接 制约 问题 ， 互 斥 是 申请 临界 资源 进程 间 的 间接 制约 问题 。 

1) 进程 间 的 同步 


在 计算 机 系统 中 ,多 个 进程 可 以 并 发 执行 , 每 个 进程 都 以 各 自 独立 的 、 不 可 预知 的 速度 向 前 
推进 ， 但 是 需要 在 某 些 确定 点 上 协调 相互 合作 进程 间 的 工作 。 例 如 ， 进 程 A 向 缓冲 区 送 数 据 ， 


图 4-5 细 分 进程 状态 及 其 转换 


so 
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进程 B 从 缓冲 区 取 数 据 加 工 ， 当 进程 B 要 取 数 据 加 工时 ， 必 须 是 进程 A 完成 了 向 缓冲 区 送 数 
据 的 操作 ， 否 则 进程 B 必须 停 下 来 等 待 进程 A 的 操作 结束 。 

可 见 ， 所 谓 进程 间 的 同步 是 指 在 系统 中 一 些 需 要 相互 合作 ， 协 同 工 作 的 进程 ， 这 样 的 相互 
联系 称 为 进程 的 同步 。 

2) 进程 间 的 互 斥 

进程 的 互 斥 是 指 系统 中 多 个 进程 因 争 用 临界 资源 而 互 斥 执行 。 在 多 道 程序 系统 环境 中 ， 
各 进程 可 以 共享 各 类 资源 ， 但 有 些 资 源 一 次 只 能 供 一 个 进程 使 用 ， 称 为 临界 资源 (Critical 
Resource，CR)， 如 打印 机 、 共 享 变 量 和 表格 等 。 

3) 临界 区 管理 的 原则 

临界 区 (Critical Section，CS) 是 进程 中 对 临界 资源 实施 操作 的 那 段 程序 。 对 互 斥 临 界 区 
管理 的 4 条 原则 如 下 。 

(1) 有 空 即 进 。 当 无 进程 处 于 临界 区 时 ， 人 允许 进程 进入 临界 区 ， 并 且 只 能 在 临界 区 运行 有 限 
的 时 间 。 

(2) 无 空 则 等 。 当 有 一 个 进程 在 临界 区 时 ， 其 他 和 欲 进入 临界 区 的 进程 必须 等 待 ， 以 保证 进 
程 互 斥 地 访问 临界 资源 。 

(3) 有 限 等 待 。 对 于 要 求 访问 临界 资源 的 进程 ， 应 保证 进程 能 在 有 限 的 时 间 进 入 临界 区 ， 
以 免 陷入 “饥饿 ”状态 。 

(4) 让 权 等 待 。 当 进程 不 能 进入 自己 的 临界 区 时 ， 应 立即 释放 处 理 机 ， 以 免 进 程 陷入 忙 等 
状态 。 


2. 信号 量 机 制 


荷兰 学 者 Dijkstra 于 1965 年 提出 的 信号 量 机 制 是 一 种 有 效 的 进程 同步 与 互 斥 工具 。 目 前 ， 
信号 量 机制 有 了 很 大 的 发 展 ， 主 要 有 整 型 信号 量 、 记 录 型 信号 量 和 信和 号 量 集 机 制 。 

1) 整 型 信号 量 与 PV 操作 

信号 量 是 一 个 整 型 变量 ， 根 据 控 制 对 象 的 不 同 被 赋予 不 同 的 值 。 信 号 量 分 为 如 下 两 类 : 

(1) 公用 信号 量 。 实 现 进程 间 的 互 斥 ， 初 值 为 1 或 资源 的 数目 。 

(2) 私 用 信号 量 。 实 现 进程 间 的 同步 ， 初 值 为 0 或 某 个 正 整数 。 

信号 量 $ 的 物理 意义 : S>0 表示 某 资源 的 可 用 数 ， 若 S<0， 则 其 绝对 值 表示 阻塞 队列 中 等 
待 该 资源 的 进程 数 。 

对 于 系统 中 的 每 个 进程 ， 其 工作 的 正确 与 否 不 仅 取决 于 它 自身 的 正确 性 ， 而 且 与 它 在 执行 
中 能 否 与 其 他 相关 进程 正确 地 实施 同步 互 斥 有 关 。PV 操作 是 实现 进程 同步 与 互 斥 的 常用 方法 。 
PP 操作 和 V 操作 是 低级 通信 和 原 语 ， 在 执行 期 间 不 可 分 割 。 其 中 ，P 操作 表示 申请 一 个 资源 ，V 
操作 表示 释放 一 个 资源 。 

了 操作 的 定义 ，S:=S-1， 若 S>0， 则 执行 P 操作 的 进程 继续 执行 ， 若 S<0， 则 置 该 进程 为 
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阻塞 状态 〈 因 为 无 可 用 资源 )， 并 将 其 插入 阻塞 队列 。 
了 操作 可 用 如 下 过 程 表 示 ， 其 中 ，Semaphore 表示 所 定义 的 变量 是 信号 量 。 


Procedure P(Var S:Semaphore): 
Begin 
S:=S—1; 
If $<0 then W(S) {执行 了 操作 的 进程 插入 等 待 队 列 } 
End; 


V 操作 定义 : S: =S+1， 若 S>0， 则 执行 V 操作 的 进程 继续 执行 ; 若 SS0， 则 从 阻塞 状态 唤 
醒 一 个 进程 ， 并 将 其 插入 就 绪 队 列 ， 然 后 执行 V 操作 的 进程 继续 。 
V 操作 可 用 如 下 过 程 表示 。 
Procedure V(Var S:Semaphore); 
Begin 
S:=S+1; 
If S<0 then R(S) {从 阻塞 队列 中 唤醒 一 个 进程 } 
End; 
2) 利用 PV 操作 实现 进程 的 互 斥 
令 信号 量 mutex 的 初 值 为 1， 当 进入 临界 区 时 执行 了 操作 ， 退 出 临界 区 时 执行 V 操作 。 这 
样 ， 利 用 PV 操作 实现 进程 互 斥 的 代码 段 如 下 : 


P(mutex) 
临界 区 
V(mutex) 
【 例 4.1】 将 交通 流量 统计 程序 改写 如 下 ， 可 实现 Pl 和 P, 间 的 互 斥 。 
Pi Bs 
L1: if 有 车 通过 then L2: begin 
begin P(mutex) 
P(mutex) PRINT COUNT: 
COUNT:=COUNT+1; COUNT:=0: 
V(mutex) V(mutex) 
end end 
GOTO L1: GOTO L2: 


3) 利用 PV 操作 实现 进程 的 同步 
进程 的 同步 是 由 于 进程 间 合 作 引起 的 相互 制约 的 问题 ， 要 实现 进程 的 同步 可 用 一 个 信号 量 
与 消息 联系 起 来 ， 当 信和 号 量 的 值 为 0 时 表示 希望 的 消息 未 产生 ， 当 信号 量 的 值 为 非 0 时 表示 希 
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望 的 消息 已 经 存在 。 假 定 用 信号 量 S 表示 某 条 消息 ， 进 程 可 以 通过 调用 了 操作 测试 消息 是 否 到 
达 ， 调 用 V 操作 通知 消息 已 准备 好 。 最 典型 的 同步 问题 是 单 缓冲 区 的 生产 者 和 消费 者 的 同步 问题 。 

【 例 4.2】 生产 者 进程 P, 不 断 地 生产 产品 送 入 缓冲 区 ， 消 费 者 进程 了, 不断 地 从 缓冲 区 中 取 
产品 消费 。 请 给 出 实现 进程 同步 的 模型 图 。 

解 : 为 了 实现 Pi 与 P, 进程 间 的 同步 问题 ， 需 要 设置 两 个 信号 量 S 和 S,， 但 信号 量 初 值 
不 同 可 有 如 下 两 种 实现 方案 。 

方案 1: 信号 量 S; 的 初 值 为 1， 表示 缓冲 区 空 ， 可 以 将 产品 送 入 缓冲 区 ; 信号 量 S 的 初 什 
为 0， 表示 缓冲 区 有 产品 。 其 同步 过 程 如 图 4-6 所 示 。 

方案 2: 信号 量 Si 的 初 值 为 0， 信和 号 量 S; 的 初 什 为 0， 此 时 同步 过 程 如 图 4-7 所 示 。 


P。 了 
生产 一 个 产品 P(S;) P(S;) 
P(S) 从 缓冲 区 取 一 个 产品 从 缓冲 区 取 一 个 产品 
产品 送 缓冲 区 V(S) V(S)) 
V(S;) 消费 消费 
图 4-6 单 缓冲 区 的 同步 举例 方法 1 图 4-7 单 缓冲 区 的 同步 举例 方法 2 


【 例 4.3】 一 个 生产 者 和 一 个 消费 者 ， 缓 冲 区 中 可 存放 件 产 品 ， 生 产 者 不 断 地 生产 产品 ， 
消费 者 不 断 地 消费 产品 ， 如 何 用 PV 操作 实现 生产 者 和 消费 者 的 同步 。 可 以 通过 设置 3 个 信号 
量 S、S1 和 S,， 其 中 ，S 是 一 个 互 斥 信号 量 ， 初 值 为 1， 因 为 缓冲 区 是 一 个 互 斥 资源 ， 所 以 需 
要 进行 互 斥 控制 ; Si 表示 是 否 可 以 将 产品 放 入 缓冲 区 ， 初 值 为 n; S:> 表示 缓冲 区 是 否 在 有 产品 ， 
初 值 为 0。 其 同步 过 程 如 图 4-8 所 示 。 


P 也 


生产 一 个 产品 P (S;) 

P(S') P(S) 

P(S) 从 缓冲 区 取 一 个 产品 
产品 送 缓冲 区 V(S) 

V(S) V (Ss) 

V (S;) 消费 


| 


图 4-8 了 个 缓冲 区 的 同步 举例 
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3. 高 级 通信 和 原 语 


进程 间 通 信 是 指 进 程 之 间 的 信息 交换 ， 少 则 一 个 信息 ， 多 则 成 千 上 万 个 信息 。 根 据 交换 信 
息 量 的 多 少 和 效率 的 高 低 , 进程 通信 的 方式 分 为 低级 方式 和 高 级 方式 。 PV 操作 属于 低级 通信 方 
式 ， 若 用 PV 操作 实现 进程 间 通 信 ， 则 存在 如 下 问题 。 

(1) 编程 难度 大 ， 通 信 对 用 户 不 透明 ， 即 要 用 户 利用 低级 通信 工具 实现 进程 间 的 同步 与 互 
斥 。 而 且 ，PYV 操作 使 用 不 当 容 易 引 起 死 锁 。 

(2) 效率 低 ， 生 产 者 每 次 只 能 向 缓冲 区 放 一 个 消息 ， 消 费 者 只 能 从 缓冲 区 取 一 个 消息 。 

为 了 提高 信号 通信 的 效率 ， 传 递 大 量 数据 ， 降 低 程序 编制 的 复杂 度 ， 系 统 引 入 了 高 级 通信 
方式 。 高 级 通信 方式 主要 分 为 共享 存储 模式 、 消 息 传递 模式 和 管道 通信 。 

(1) 共享 存储 模式 。 相 互通 信 的 进程 共享 某 些 数据 结构 或 存储 区 ) 实现 进程 之 间 的 通信 。 

(2) 消息 传递 模式 。 进 程 间 的 数据 交换 以 消息 为 单位 ， 程 序 员 直接 利用 系统 提供 的 一 组 通 
信 命 令 〈 原 语 ) 来 实现 通信 ， 如 Send(A)、Receive(A)。 

(3) 管道 通信 。 所 谓 管道 ， 是 指 用 于 连接 一 个 读 进 程 和 一 个 写 进程 ， 以 实现 它们 之 间 通 信 
的 共享 文件 (pipe 文件 )。 向 管道 (共享 文件 ) 提供 输入 的 发 送 进程 〈 即 写 进程 )， 以 字符 流 的 
形式 将 大 量 的 数据 送 入 管道 ; 而 接收 进程 可 从 管道 接收 大 量 的 数据 。 由 于 它们 通信 时 采用 管道 ， 
所 以 称 为 管道 通信 。 
4.2.4” 管 程 

1， 管 程 的 引入 


若 用 信号 量 和 了 、V 操作 来 解决 进程 的 同步 与 互 斥 问题 ， 需 要 在 程序 中 的 适当 位 置 安排 P、 
V 操作 ， 否 则 会 造成 死 锁 错误 。 为 了 解决 分 散 编程 带 来 的 困难 ，1974 年 和 1975 年 汉 森 (Brinsh 
Hansen) 和 和 霍 尔 (Hoare) 提出 了 另 一 种 同步 机 制 一 一 管 程 (Monitor)。 其 基本 思路 是 采用 资源 
集中 管理 的 方法 ， 将 系统 中 的 资源 用 某 种 数据 结构 抽象 地 表示 出 来 。 由 于 临界 区 是 访问 共享 资 
源 的 代码 段 ， 建 立 一 个 管 程 管理 进程 提出 的 访问 请 求 。 

采用 这 种 方式 对 共享 资源 的 管理 就 可 以 借助 数据 结构 及 在 其 上 实施 操作 的 若干 过 程 来 进 
行 ， 对 共享 资源 的 申请 和 释放 可 以 通过 过 程 在 数据 结构 上 的 操作 来 实现 。 

管 程 由 一 些 共享 数据 、 一 组 能 为 并 发 进程 所 执行 的 作用 在 共享 数据 上 的 操作 的 集合 、 初 始 
代码 以 及 存 取 权 组 成 。 管 程 提 供 了 一 种 可 以 允许 多 进程 安全 、 有 效 地 共享 抽象 数据 类 型 的 机 制 ， 
管 程 实现 同步 机 制 由 “条 件 结构 〈Condition Construct)” 所 提供 。 为 实现 进程 互 斥 同步 ， 必 须 
定义 一 些 条 件 变量 , 例如 var notempty、notfull: condition, 这 些 条 件 变量 只 能 被 wait 和 signal 操 
作 所 访问 。notfull.wait 操作 意味 着 调用 该 操作 的 进程 将 被 挂 起 ， 使 另 一 个 进程 执行 ;而 
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notfull.signal 操作 仅仅 是 启动 一 个 被 挂 起 的 进程 ,如 无 挂 起 进程 ， 则 notfull.signal 操作 相当 于 空 
操作 ， 不 改变 notfull 状态 ， 这 不 同 于 V 操作 。 
2. 管 程 的 结构 


每 一 个 管 程 都 要 有 一 个 名 字 以 供 标识 ， 用 语言 来 写 一 个 管 程 的 形式 如 下 : 


Type < 管 程 名 >=monitor 
< 管 程 变量 说 明 >; 
define < (能 被 其 他 模块 引用 的 ) 过 程 名 列表 >; 
procedure < 过 程 名 > (< 形式 参数 表 >) 
begin 
< 过 程 体 >; 


end; 


pe < 过 程 名 > (< 形式 参数 表 >) 
begin 
< 过 程 体 >; 


end; 


begin 
< 管 程 的 局 部 数据 初始 化 语句 >; 


end. 


3， 利用 管 程 解决 生产 者 一 消费 者 问题 

【 例 4.4】 建立 一 个 管 程 Producer-Consumer， 它 包括 两 个 过 程 put (item) 和 get (item)， 
分 别 执行 将 生产 的 消息 放 入 缓冲 池 和 从 缓冲 池 取 出 消息 的 操作 ， 设 置 变量 count 表示 缓冲 池 已 
存 消息 的 数目 。 管 程 描述 如 下 : 


Type Producer-Consumer=monitor 
var buffer : array [ 0, .… ,n-1] of item ; {定义 缓冲 区 } 


in , out , count : integer ; {in out 为 存 取 指 针 ,count 为 缓冲 区 产品 个 数 } 
notfull ,notempty :condition ; {条 件 变 量 } 
procedure entry put (item) 
begin 


让 count>=n then notfull-wait: {缓冲 区 已 满 } 
buffer (in ) := nextp ; 


in:=(intl) modn; 


count= count+1; 
过 notempty.queue ”then notempty.signal ; {唤醒 等 待 者 } 
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end 


procedure entry get (item) 
begin 
ifcount<=0 then notempty.wait; 
nextc := buffer ( out ) ; 
out := (out+l) modn ; 
count := count- 1; 


{缓冲 区 已 空 } 


{减少 一 个 产品 } 


过 ”notfull.queue then notfull.signal: 。 {唤醒 等 待 者 } 
end 
begin in:=out:=0:; count:=0; end {初始 化 } 


利用 管 程 解决 生产 者 一 消费 者 问题 ， 其 中 生产 者 和 消费 者 程序 如 下 : 


producer : begin 
repeat 
producean item innextp; 
Producer-Consumer.put ( item) ; 
until false; 
end 
consumer : begin 
repeat 
Producer-Consumer.get (item) ; 
consume the item in nexte : 
until false ; 
end; 


coend 


4.2.5 ”进程 调度 


cobegin 


进程 调度 方式 是 指 当 有 更 高 优先 级 的 进程 到 来 时 如 何 分 配 CPU。 调度 方式 分 为 可 剥夺 和 不 
可 剥夺 两 种 。 可 剥夺 式 是 指 当 有 更 高 优先 级 的 进程 到 来 时 , 强行 将 正在 运行 进程 的 CPU 分 配给 
高 优先 级 的 进程 ， 不 可 剥夺 式 是 指 当 有 更 高 优先 级 的 进程 到 来 时 ， 必 须 等 待 正 在 运行 进程 自动 


释放 占用 的 CPU， 然 后 将 CPU 分 配给 高 优先 级 的 进程 。 
1. 三 级 调度 


在 某 些 操作 系统 中 ， 一 个 作业 从 提交 到 完成 需要 经 历 高 、 中 、 低 三 级 调度 。 
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(1) 高 级 调度 。 高 级 调度 又 称 “ 长 调度 ”“ 作 业 调 度 ” 或 “接纳 调度 ” 它 决定 处 于 输入 池 
中 的 哪个 后 备 作 业 可 以 调 入 主 系统 做 好 运行 的 准备 ， 成 为 一 个 或 一 组 就 绪 进程 。 在 系统 中 一 个 
作业 只 需 经 过 一 次 高 级 调度 。 

(2) 中 级 调度 。 中 级 调度 又 称 “ 中 程 调度 ”或 “对 换 调度 ” 它 决定 处 于 交换 区 中 的 哪个 
就 绪 进 程 可 以 调 入 内 存 ， 以 便 直 接 参与 对 CPU 的 竞争 。 在 内存 资 源 紧张 时 , 为 了 将 进程 调 入 内 
存 ， 必 须 将 内 存 中 处 于 阻塞 状态 的 进程 调 出 至 交换 区 ， 以 便 为 调 入 进程 腾 出 空间 。 这 相当 于 使 
处 于 内 存 的 进程 和 处 于 盘 交 换 区 的 进程 交换 了 位 置 。 

(3) 低级 调度 。 低 级 调度 又 称 “短程 调度 ”或 “进程 调度 ”， 它 决定 处 于 内 存 中 的 哪个 
就 绪 进 程 可 以 占用 CPU。 低 级 调度 是 操作 系统 中 最 活跃 、 最 重要 的 调度 程序 ， 对 系统 的 影响 
很 大 。 

2， 调度 算法 


常用 的 进程 调度 算法 有 先 来 先 服务 、 时 间 片 轮转 、 优 先 级 调度 和 多 级 反馈 调度 算法 。 

(1) 先 来 先 服务 (FCFS)。FCFS 按照 作业 提交 或 进程 成 为 就 绪 状 态 的 先后 次 序 分 配 CPU， 
即 进程 调度 总 是 将 就 绪 队 列队 首 的 进程 投入 运行 。 FCFS 的 特点 是 比较 有 利于 长 作业 ， 而 不 利于 
短 作 业 ; 有 利于 CPU 繁忙 的 作业 ， 而 不 利于 IO 繁忙 的 作业 。FCES 算法 主要 用 于 宏观 调度 。 

(2) 时 间 片 轮转 。 时 间 片 轮转 算法 主要 用 于 微观 调度 ， 其 设计 目标 是 提高 资源 利用 率 。 通 
过 时 间 片 轮转 提高 进程 并 发 性 和 响应 时 间 特 性 ， 从 而 提高 资源 利用 率 。 时 间 片 的 长 度 可 以 从 几 毫 
秒 到 几 百 毫秒 ， 选 择 的 方法 一 般 有 如 下 两 种 。 

@ 固定 时 间 片 。 分 配给 每 个 进程 相等 的 时 间 片 ， 使 所 有 进程 都 公平 执行 ， 它 是 一 种 实现 
简单 且 有 效 的 方法 。 

@ 可 变 时 间 片 。 根 据 进程 不 同 的 要 求 对 时 间 片 的 大 小 实时 修改 ， 可 以 更 好 地 提高 效率 。 

(3) 优先 级 调度 。 优 先 级 调度 算法 是 让 每 一 个 进程 都 拥有 一 个 优先 数 ， 数 值 大 的 表示 优先 
级 高 ， 系 统 在 调度 时 总 选择 优先 数 大 的 占用 CPU。 优 先 级 调度 分 为 静态 优先 级 和 动态 优先 级 
两 种 。 

Q@ 静态 优先 级 。 进 程 的 优先 级 在 创建 时 确定 ， 直 到 进程 终止 都 不 会 改变 。 通 常 根据 以 下 
因素 确定 优先 级 : 进程 类 型 (如 系统 进程 优先 级 较 高 )、 对 资源 的 需求 (如 对 CPU 和 内 存 需 求 
较 少 的 进程 优先 级 较 高 )、 用 户 要 求 〈 如 紧迫 程度 和 付费 多 少 )。 

@ 动态 优先 级 。 在 创建 进程 时 赋予 一 个 优先 级 ， 在 进程 运行 过 程 中 还 可 以 改变 ， 以 便 获 
得 更 好 的 调度 性 能 。 例 如 ， 在 就 绪 队 列 中 ， 随 着 等 待 时 间 增 长 ， 优 先 级 将 提高 。 这 样 ， 对 于 优 
先 级 较 低 的 进程 在 等 待 足够 的 时 间 后 , 其 优先 级 提高 到 可 被 调度 执行 。 进程 每 执行 一 个 时 间 片 ， 
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就 降低 其 优先 级 ， 从 而 当 一 个 进程 持续 执行 时 ， 其 优先 级 会 降低 到 让 出 CPU。 
(4) 多 级 反馈 调度 。 多 级 反馈 队列 调度 算法 如 图 4-9 所 示 ， 该 算法 是 时 间 片 轮转 算法 和 优 
先 级 算法 的 综合 与 发 展 。 其 优点 有 三 个 方面 : 第 一 ， 照 顾 了 短 进程 以 提高 系统 吞吐 量 、 缩 短 了 
平均 周转 时 间 ;， 第 二 ， 照 顾 IO 型 进程 以 获得 较 好 的 IO 设备 利用 率 和 缩短 响应 时 间 ， 第 三 ， 
不 必 估计 进程 的 执行 时 间 ， 动 态 调节 优先 级 。 
降低 优先 级 


最 高 优先 级 队列 
次 高 优先 级 队列 


> 丙 弄 津 


低 优 先 级 队列 
就 绪 进 程 


图 4-9 多 级 反馈 队列 调度 算法 


多 级 反馈 队列 调度 算法 实现 思路 如 下 。 

@ 设置 多 个 就 绪 队 列 。 队 列 1， 队 列 2，…， 队 列 分 别 赋 予 不 同 的 优先 级 ， 队 列 1 的 优 
先 级 > 队列 2 的 优先 级 >…> 队 列 n 的 优先 级 。 每 个 队列 执行 时 间 片 的 长 度 也 不 同 ， 规 定 优先 级 
越 低 时 间 片 越 长 ， 如 逐 级 加 倍 。 

@ 新 进程 进入 内 存 后 ， 先 投入 队列 1 的 末尾 ， 按 FCFS 算法 调度 ， 若 某 进程 在 队列 1 的 
一 个 时 间 片 内 未 能 执行 完 ， 则 降低 投入 到 队列 2 的 末尾 ， 同 样 按 FCFS 算法 调度 ， 如 此 下 去 ， 
当 进 程 降低 到 最 后 的 队列 时 ， 则 按 “ 时 间 片 轮转 ”算法 调度 直到 完成 。 

@ 仅 当 较 高 优先 级 的 队列 为 空 才 调度 较 低 优先 级 队列 中 的 进程 执行 。 如 果 进 程 执行 时 有 
新 进程 进入 较 高 优先 级 的 队列 ， 则 抢先 执行 新 进程 ， 并 把 被 抢先 的 进程 投入 原 队 列 的 末尾 。 


3. 进程 优先 级 确定 


优先 级 确定 需要 考虑 如 下 情况 。 

(1) 对 于 IO 型 进程 ， 让 其 进入 最 高 优先 级 队列 ， 以 及 时 响应 需要 IO 交互 的 进程 。 通 常 
执行 一 个 小 的 时 间 片 , 在 该 时 间 片 内 要 求 可 处 理 完 一 次 JJO 请 求 的 数据 , 然后 转 入 到 阻塞 队列 。 

(2) 对 于 计算 型 进程 ， 每 次 都 执行 完 时 间 片 后 进入 更 低级 队列 。 最 终 采 用 最 大 时 间 片 来 执 
行 ， 以 减少 调度 次 数 。 

(3) 对 于 IO 次 数 不 多 ， 主 要 是 CPU 处 理 的 进程 ， 在 IO 完成 后 ， 返 回 优先 IO 请 求 时 离 
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的 队列 ， 以 免 每 次 都 回 到 最 高 优先 级 队列 后 再 逐次 下 降 。 

(4) 为 适应 一 个 进程 在 不 同时 间 段 的 运行 特点 ，IO 完成 时 ， 提 高 优先 级 ; 时 间 片 用 完 时 ， 
降低 优先 级 。 
4.2.6 死 锁 


在 计算 机 系统 中 有 许多 互 斥资 源 (如 磁带 机 、 打 印 机 和 绘图 仪 等 ) 或 软件 资源 (如 进程 表 、 
临界 区 等 )， 若 两 个 进程 同时 使 用 打印 机 ， 或 同时 进入 临界 区 必然 会 出 现 问题 。 所 谓 死 锁 ， 是 
指 两 个 以 上 的 进程 互相 都 要 求 对 方 已 经 占有 的 资源 导致 无 法 继续 运行 下 去 的 现象 。 


1， 死 锁 举 例 


【 例 4.5】 进程 推进 顺序 不 当 引起 的 死 锁 。 设 系统 中 有 一 台 读 卡 机 A， 一 台 打 印 机 B， 它 
们 被 进程 PP 和 Ps 共享 ， 两 个 进程 并 发 执行 ， 它 们 按 下 列 顺序 请 求 和 释放 资源 。 


Pp 


Request(A); <a> Request(B); <a> 
Request(B); <b> Request(A): <b> 
Release(B): Release(A); 
Release(A); Release(B); 


假如 按 Pl<a> P<a> Pi<b> 已 <b> 的 次 序 执行 ， 则 系统 会 发 生死 锁 。 因 为 进程 Pl<a> 时 ， 由 
于 读 卡 机 未 被 占用 ， 所 以 请 求 可 以 得 到 满足 ， 进程 P<a> 时 ， 由 于 打印 机 未 被 占用 ， 所 以 请 求 
也 可 以 得 到 满足 。 接 着 进程 PJ.<b> 时 ， 由 于 打印 机 被 占用 ， 所 以 请 求 得 不 到 满足 ，P 等 待 ， 进 
程 P<b> 时 ， 由 于 读 卡 机 被 占用 ， 所 以 请 求 得 不 到 满足 ，P, 也 等 待 ， 导 致 互相 在 请 求 对 方 已 占 
有 的 资源 ， 系 统 发 生死 锁 。 

【 例 4.6】 同类 资源 分 配 不 当 引 起 死 锁 。 若 系统 中 有 m 个 资源 被 n 个 进程 共享 ， 当 每 个 进 
程 都 要 求 丰 个 资源 ， 而 m<nk 时， 即 资源 数 小 于 进程 所 要 求 的 总 数 时 ， 可 能 会 引起 死 锁 。 例 如 ， 
m=5，n=3， 且 3， 若 系统 采用 的 分 配 策略 是 轮流 地 为 每 个 进程 分 配 ， 则 第 一 轮 系统 先 为 每 个 进 
程 分 配 一 台 ， 还 剩 下 两 台 ; 第 二 轮 系统 再 为 两 个 进程 各 分 配 一 台 ， 此 时 ， 系 统 中 已 无 可 供 分 配 
的 资源 ， 使 得 各 个 进程 都 处 于 等 待 状态 导致 系统 发 生死 锁 。 

【 例 4.7】 PV 操作 使 用 不 当 引 起 的 死 锁 。 对 于 图 4-10， 当 信号 量 Si=S=-0 时 将 发 生死 锁 。 

从 图 4-10 可 知 ， 书 进程 从 缓冲 区 取 产 品 前 ， 先 执行 PCS)， 由 于 S,=-1， 故 P 等 待 ，P 进 
程 将 产品 送 到 缓冲 区 后 ， 执 行 Ps)， 由 于 $=-1， 故 Pi 等待。 这 样 ，Pl、P, 进程 都 无 法 继续 运 
行 下 去 ， 导 致 系统 死 锁 。 


生产 一 个 产品 

产品 送 缓冲 区 
P(S) 
V(S) 


2.， 死 锁 产生 的 原因 及 4 个 必要 条 件 
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P(S;) 
区 取 一 个 产品 


V(S') 
消费 


Be 


图 4-10 PV 操作 引起 的 死 锁 


从 上 述 例题 分 析 可 以 看 出 ， 产 生死 锁 的 原因 为 竞争 资源 及 进程 推进 顺序 非法 。 当 系统 中 有 
多 个 进程 所 共享 的 资源 不 足以 同时 满足 它们 的 需求 时 ， 将 引起 它们 对 资源 的 竞争 导致 死 锁 。 进 
程 推进 顺序 非法 ， 指 进程 在 运行 的 过 程 中 请 求 和 释放 资源 的 
顺序 不 当 ， 导 致 进程 死 锁 。 产 生死 锁 的 4 个 必要 条 件 是 互 斥 


条 件 、 请 求 保持 条 件 、 不 可 和 剥夺 条 件 和 环 路 条 件 。 


当 发 生死 锁 时 ， 在 进程 资源 有 向 图 中 必 构 成 环 路 ， 其 中 
每 个 进程 占有 了 下 一 个 进程 申请 的 一 个 或 多 个 资源 ， 如 图 


4-11 所 示 。 


进程 资源 有 向 图 由 方 框 、 圆 图 和 有 向 边 三 部 分 组 成 。 其 


中 方 框 表示 资源 ， 圆 图表 示 进 程 。 请 求 资源 : O 一 


， 箭 头 


由 进程 指向 资源 ; 分 配 资源 : OO 一口， 箭头 由 资源 指向 进程 。 


3， 死 锁 的 处 理 


RO O | R: 


图 4-11 进程 资源 有 向 图 


死 锁 的 处 理 策略 主要 有 4 种 : 锟 乌 策略 〈 即 不 理 皮 策 略 )、 预 防 策略 、 避 免 策 略 和 检测 与 


解除 死 锁 。 
1) 死 锁 预 防 


死 锁 预 防 是 采用 某 种 策略 限制 并 发 进程 对 资源 的 请 求 ,破坏 死 锁 产生 的 4 个 必要 条 件 之 一 ， 
使 系统 在 任何 时 刻 都 不 满足 死 锁 的 必要 条 件 。 预 防 死 锁 的 两 种 策略 如 下 。 

(1) 预先 静态 分 配 法 。 破 坏 了 “不 可 剥夺 条 件 ” 预先 分 配 所 需 资源 ， 保 证 不 等 待 资源 。 
该 方法 的 问题 是 降低 了 对 资源 的 利用 率 ， 降 低 进程 的 并 发 程度 : 有 时 可 能 无 法 预先 知道 所 需 


资源 。 


上 
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(2) 资源 有 序 分 配 法 。 破 坏 了 “ 环 路 条 件 ” 把 资源 分 类 按 顺 序 排列 ， 保 证 不 形成 环 路 。 
该 方法 存在 的 问题 是 限制 进程 对 资源 的 请 求 ， 由 于 资源 的 排序 占用 系统 开销 。 

2) 死 锁 避免 

死 锁 预防 是 设法 破坏 产生 死 锁 的 4 个 必要 条 件 之 一 ， 严 格 防止 死 锁 的 产生 。 死 锁 避 免 则 不 
那么 严格 地 限制 产生 死 锁 的 必要 条 件 。 最 著名 的 死 锁 避 免 算法 是 Dijkstra 提出 的 银行 家 算法 ， 
死 锁 避免 算法 需要 很 大 的 系统 开销 。 

银行 家 算法 对 于 进程 发 出 的 每 一 个 系统 可 以 满足 的 资源 请 求 命令 加 以 检测 ， 如 果 发 现 分 
配 资源 后 系统 进入 不 安全 状态 ， 则 不 予 分 配 ， 若 分 配 资源 后 系统 仍 处 于 安全 状态 ， 则 实施 分 
配 。 与 死 锁 预防 策略 相 比 ， 它 提高 了 资源 的 利用 率 ， 但 检测 分 配 资源 后 系统 是 否 安全 增加 了 系统 
销 


所 谓 安全 状态 ， 是 指 系统 能 按 某 种 顺序 如 < 且 , 忆 ,…, PP > 来 为 每 个 进程 分 配 其 所 需 资源 ， 
直到 最 大 需求 ， 使 每 个 进程 都 可 顺序 完成 。 通 常 称 < 五 , 忆 ,…, 已 > 序列 为 安全 序列 。 若 系统 不 
存在 这 样 一 个 安全 序列 ， 则 称 系统 处 于 不 安全 状态 。 

【 例 4.8】 假设 系统 中 有 三 类 互 斥资 源 RJ、Rs 和 R83， 可 用 资源 数 分 别 为 8、7 和 4。 在 To 
时 刻 系统 中 有 P1、P,、P;、Ps 和 Ps 这 5 个 进程 ， 这 些 进程 对 资源 的 最 大 需求 量 和 已 分 配 资源 
数 如 图 4-12 所 示 。 


图 4-12 ”进程 已 分 配 资源 数 


若 有 如 下 4 个 执行 序列 ， 那 么 进程 按 什 么 序列 执行 ， 系 统 状态 是 安全 的 。 

© 忆 一 PP 一 Pi 一 P 一 户 Q@ P,—P—P—P;s—P, 

®@ 已 一 忆 一 Pi 一 PP 一 户 @ P=P, Ps =P oP, 

解 : 初始 时 系统 的 可 用 资源 数 分 别 为 8、7 和 4, 在 To 时 刻 已 分 配 资源 数 分 别 为 7、6 和 4， 
因此 系统 剩余 的 可 用 资源 数 分 别 为 1、1 和 0。 

由 于 Rs 资源 为 0， 系统 不 能 再 分 配 Rs 资源 了 ， 所 以 不 能 一 开始 就 运行 需要 分 配 Rs 资源 的 
进程 P 和 P,， 故 各 显然 是 不 安全 的 。 
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分 析 序 列 @@ 的 已 一 已 一 已 一 P: 一 户 是 否 安全 。 进程 P 可 以 设置 能 完成 标志 True, 如 图 4-13 
所 示 。 


资源 可 用 需求 已 分 可 用 + 已 分 “| 能 否 完 | 
进程 R1 R Rs R1 R, Rs R1 R, Rs 省 吉本 成 标志 
| Ps it 1 0 0 二 2 | Tme | 
| P 2 0 1 1 | 4 :4 2 Tme | 
| P 4 4 2 | 3 WW | 


图 4-13 进程 按 序 列 @ 的 PP 一 Pi 一 Ps 一 P 执 行 


因为 系统 的 可 用 资源 数 为 (1，1，0)， 而 进程 P 只 需要 一 台 Ri 资源。 进程 P 可 以 设置 能 
完成 标志 True,， 因为 进程 P 运 行 完 毕 将 释放 所 有 资源 , 此 时 系统 的 可 用 资源 数 应 为 (2, 3, 1)， 
而 进程 P, 只 需要 “0，1，1)， 进 程 忆 运行 完毕 将 释放 所 有 资源 ， 此 时 系统 的 可 用 资源 数 应 为 
(4，4，2)。 进 程 Pi 不 能 设置 能 完成 标志 True， 因 为 进程 Pi 需要 R, 资源 为 S， 系 统 能 提供 的 
忆 资源 为 4， 所 以 序列 @@ 无 法 进行 下 去 ， 因 此 ， 已 一 忆 一 PP 一 户 一 户 为 不 安全 序列 。 

序列 图 的 Ps 一 P,P; 一 Pi 一 P 是 安全 的 ， 因 为 所 有 的 进程 都 能 设置 完成 标志 True， 如 图 
4-14 所 示 。 


Ea 可 用 + 已 分 能 否 完 
R! R, Rs 成 标志 


图 4-14 ”进程 按 序 列 @ 的 Py 玉 P,PsP1 情 执行 


3) 死 锁 检测 

解决 死 锁 的 另 一 条 途径 是 使 用 死 锁 检测 方法 , 这 种 方法 对 资源 的 分 配 不 加 限制 即 允 许 死 锁 
产生 。 但 系统 定时 地 运行 一 个 死 锁 检测 程序 ， 判 断 系 统 是 否 发 生死 锁 ， 若 检测 到 有 死 锁 ， 则 设法 
加 以 解除 。 

4) 死 锁 解除 

死 锁 解除 通常 采用 如 下 方法 。 

(1) 资源 剥夺 法 。 从 一 些 进程 那里 强行 剥夺 足够 数量 的 资源 分 配给 死 锁 进程 。 

(2) 撤销 进程 法 。 根 据 某 种 策略 逐个 地 撤销 死 锁 进 程 ， 直 到 解除 死 锁 为 止 。 
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4.2.7 ”线程 


传统 的 进程 有 两 个 基本 属性 : 可 拥有 资源 的 独立 单位 ; 可 独立 调度 和 分 配 的 基本 单位 。 引 
入 线程 的 原因 是 进程 在 创建 、 撤 销 和 切换 中 ， 系 统 必须 为 之 付出 较 大 的 时 空 开销 ， 故 在 系统 中 
设置 的 进程 数目 不 宜 过 多 ， 进 程 切换 的 频率 不 宜 太 高 ， 这 就 限制 了 并 发 程度 的 提高 。 引 入 线程 
后 ， 将 传统 进程 的 两 个 基本 属性 分 开 ， 线 程 作为 调度 和 分 配 的 基本 单位 ， 进 程 作 为 独立 分 配 资 
源 的 单位 。 用 户 可 以 通过 创建 线程 来 完成 任务 ， 以 减少 程序 并 发 执行 时 付出 的 时 空 开销 。 

例如 ， 在 文件 服务 进程 中 可 设置 多 个 服务 线程 ， 当 一 个 线程 受阻 时 ， 第 二 个 线程 可 以 继续 
运行 ， 当 第 二 个 线程 受阻 时 ， 第 三 个 线程 可 以 继续 运行 …… 从 而 显著 地 提高 了 文件 系统 的 服务 
质量 及 系统 的 吞吐 量 。 

这 样 ， 对 于 拥有 资源 的 基本 单位 ， 不 用 频繁 地 切换 ， 进 一 步 提 高 了 系统 中 各 程序 的 并 发 程 
度 。 需 要 说 明 的 是 ， 线 程 是 进程 中 的 一 个 实体 ， 是 被 系统 独立 分 配 和 调度 的 基本 单位 。 线 程 基 
本 上 不 拥有 资源 ， 只 拥有 一 点 运行 中 必 不 可 少 的 资源 (如 程序 计数 器 、 一 组 寄存 器 和 栈 )， 它 
可 与 同属 一 个 进程 的 其 他 线程 共享 进程 所 拥有 的 全 部 资源 。 

线程 也 具有 就 绕 、 运 行 和 阻塞 3 种 基本 状态 。 由 于 线程 具有 许多 传统 进程 所 具有 的 特性 ， 
故 称 为 “轻型 进程 (Light-Weight Process)”; 传统 进程 称 为 “重型 进程 (Heavy-Weight 
Process)”。 线程 可 创建 男 一 个 线程 ， 同 一 个 进程 中 的 多 个 线程 可 并 发 执行 。 

线程 分 为 用 户 级 线程 (User-Level Threads) 和 内 核 支持 线程 (Kernel-Supported Threads) 
两 类 。 用 户 级 线程 不 依赖 于 内 核 ， 该 类 线程 的 创建 、 撤 销 和 切换 都 不 利用 系统 调用 来 实现 ;内 
核 支持 线程 依赖 于 内 核 ， 即 无 论 是 在 用 户 进程 中 的 线程 ， 还 是 在 系统 中 的 线程 ， 它 们 的 创建 、 
撤销 和 切换 都 利用 系统 调用 来 实现 。 某 些 系统 同时 实现 了 两 种 类 型 的 线程 。 

与 线程 不 同 的 是 ， 不 论 是 系统 进程 还 是 用 户 进程 ， 在 进行 切换 时 ， 都 要 依赖 于 内 核 中 的 进 
程 调度 。 因 此 ， 不 论 是 什么 进程 都 是 与 内 核 有 关 的 ， 是 在 内 核 支持 下 进行 切换 的 。 尽 管线 程 和 
进程 表面 上 看 起 来 相似 ， 但 它们 在 本 质 上 是 不 同 的 。 


4.3 ”存储 管理 


存储 器 管理 的 对 象 是 主 存 存储 器 简称 主 存 或 内 存 。 存 储 器 是 计算 机 系统 中 的 关键 性 资源 ， 
是 存放 各 种 信息 的 主要 场所 。 尽 管 近年 来 内 存 越 来 越 便宜 、 容 量 越 来 越 大 ， 但 系统 软件 、 应 用 
软件 在 功能 及 其 所 需 存储 空间 等 方面 都 在 急剧 膨胀 ， 如 何 对 存储 器 实施 有 效 的 管理 ， 不 仅 直 接 
影响 到 存储 器 的 利用 率 ， 而 且 还 对 系统 性 能 有 很 大 的 影响 。 存 储 器 管理 的 主要 功能 包括 主 存 空 
间 的 分 配 和 回收 、 提 高 主 存 的 利用 率 、 扩 充 主 存 、 对 主 存 信息 实现 有 效 保护 。 
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4.3.1 基本 概念 
1， 存 储 器 的 结构 


存储 组 织 的 功能 是 在 存储 技术 和 CPU 寻 址 技 
术 许 可 的 范围 内 组 织 合理 的 存储 结构 ， 使 得 各 层次 
的 存储 器 都 处 于 均衡 的 繁忙 状态 。 常 用 的 存储 器 的 
结构 有 “寄存 器 - 主 存 -外 存 ” 结构 和 “寄存 器 -缓存 - 
主 存 -存储 组 织 的 功能 外 存 "结构 (如 图 4-15 所 示 )。 | 

(1) 虚拟 地 址 。 对 于 程序 员 来 说 ， 数 据 的 存放 
地 址 是 由 符号 决定 的 ， 故 称 符号 名 地 址 ， 或 者 称 为 
名 地 址 ， 而 把 源 程序 的 地 址 空间 称 为 符号 名 地 址 空间 或 者 名 空间 。 它 是 从 0 号 单元 开始 编 址 ， 
闪 顺 序 分 配 所 有 的 符号 名 所 对 应 的 地 址 单元 , 所 以 它 不 是 主 存 中 的 真实 地 址 , 故 称 为 相对 地 址 、 
程序 地 址 、 罗 辑 地 址 或 虚拟 地 址 。 

(2) 地 址 空间 。 把 程序 中 由 符号 名 组 成 的 空间 称 为 名 空间 。 源 程序 经 过 汇编 或 编译 后 再 经 
过 链接 编辑 程序 加 工 形成 程序 的 装配 模块 ， 即 转换 为 相对 地 址 编 址 的 模块 ， 它 是 以 0 为 基 址 顺 
序 进行 编 址 的 。 相 对 地 址 也 称 为 迎 辑 地 址 或 虐 地 址 ， 把 程序 中 由 相对 地 址 组 成 的 空间 称 为 好 加 
地 址 空间 。 相 对 地 址 空间 通过 地 址 再 定位 机 构 转换 到 绝对 地 址 空间 ， 绝 对 地 址 空间 也 称 为 物理 
地 址 空间 。 

(3) 存储 空间 。 简 单 来 说 ， 罗 辑 地 址 空间 〔 简 称 地 址 空间 ) 是 逻辑 地 址 的 集合 ， 物 理 地 址 
空间 《简称 存储 空间 ) 是 物理 地 址 的 集合 。 


2， 地 址 重 定位 


寄存 器 (Register) 
高 速 缓存 (Cache) 
主 存 (PrimaryStorage) 


外 存 (Secondary Storage) 


图 4-15 存储 器 的 层次 结构 


地 址 重 定位 是 指 将 逻辑 地 址 变换 成 主 存 物理 地 址 的 过 程 。 在 可 执行 文件 装 入 时 ， 需 要 解决 
可 执行 文件 中 地 址 《指令 和 数据 ) 与 主 存 地 址 的 对 应 关系 ， 由 操作 系统 中 的 装 入 程序 Loader 和 
地 址 重 定位 机 构 来 完成 。 地 址 重 定位 分 为 静态 地 址 重 定位 和 动态 地 址 重 定位 。 

(1) 静态 重 定位 。 静 态 重 定位 是 指 在 程序 装 入 主 存 时 已 经 完成 了 逻辑 地 址 到 物理 地 址 的 变 
换 ， 在 程序 的 执行 期 间 将 不 会 再 发 生变 化 。 静 态 地 址 重 定位 的 优点 是 无 须 硬件 地 址 变换 机 构 的 
支持 ， 它 只 要 求 程序 本 身 是 可 重 定 位 的 ， 只 对 那些 要 修改 的 地 址 部 分 具有 某 种 标识 ， 由 专门 设 
计 的 程序 来 完成 。 在 早期 的 操作 系统 中 大 多 采用 这 种 方法 。 静 态 重 定位 的 缺点 是 必须 给 作业 分 
配 一 个 连续 的 存储 区 域 ， 在 作业 的 执行 期 间 不 能 扩充 存储 空间 ， 也 不 能 在 主 存 中 移动 ， 多 个 作 
业 也 难以 共享 主 存 中 的 同一 程序 副本 和 数据 。 


2 


国 2o4 基 。 钦 人 设计 师 教程 (第 5 版 ) 


(2) 动态 重 定位 。 动 态 重 定位 是 指 在 程序 运行 期 间 完 成 逻辑 地 址 到 物理 地 址 的 变换 。 其 实 
现 机 制 要 依赖 硬件 地 址 变换 机 构 ， 如 基地 址 寄存 器 (BR)。 动 态 地 址 重 定位 的 优点 是 程序 在 执 
行 期 间 可 以 换 入 和 换 出 主 存 ， 以 解决 主 存 空间 不 足 的 问题 ， 可 以 在 主 存 中 移动 ， 把 主 存 中 的 碎 
片 集中 起 来 ， 以 充分 利用 空间 ;不 必 给 程序 分 配 连续 的 主 存 空间 ， 可 以 较 好 地 利用 较 小 的 主 存 
块 ， 可 以 实现 共享 。 


4.3.2 ”存储 管理 方案 
存储 管理 的 主要 目的 是 解决 多 个 用 户 使 用 主 存 的 问题 ， 其 存储 管理 方案 主要 包括 分 区 存储 


管理 、 分 页 存储 管理 、 分 段 存储 管理 、 段 页 式 存储 管理 以 及 虚拟 存储 管理 。 本 小 节 介绍 分 区 存 
储 管理 方案 ， 其 他 存储 管理 方案 将 在 后 续 章节 中 介绍 。 


1. 分 区 存储 管理 


分 区 存储 管理 是 早期 的 存储 管理 方案 ， 其 基本 思想 是 把 主 存 的 用 户 区 划分 成 若干 个 区 域 ， 
每 个 区 域 分 配给 一 个 用 户 作业 使 用 ， 并 限定 它们 只 能 在 自己 的 区 域 中 运行 ， 这 种 主 存 分 配方 案 
就 是 分 区 存储 管理 方式 。 按 划分 方式 不 同 分 区 可 分 为 固定 分 区 、 可 变 分 区 和 可 重 定位 分 区 。 

(1) 固定 分 区 。 固定 分 区 是 一 种 静态 分 区 方式 , 在 系统 生成 时 已 将 主 存 划分 为 若干 个 分 区 ， 
每 个 分 区 的 大 小 可 不 等 。 操 作 系 统 通过 主 存 分配 情 况 表 管理 主 存 。 这 种 方法 的 突出 问题 是 已 分 
配 区 中 存在 未 用 空间 ， 原 因 是 程序 或 作业 的 大 小 不 可 能 刚好 等 于 分 区 的 大 小 ， 故 造成 了 空间 的 
浪费 。 通 常 将 已 分 配 分 区 内 的 未 用 空间 称 为 零头 或 内 碎片 。 

(2) 可 变 分 区 。 可 变 分 区 是 一 种 动态 分 区 方式 ， 存 储 空间 的 划分 是 在 作业 装 入 时 进行 的 ， 
故 分 区 的 个 数 是 可 变 的 ， 分 区 的 大 小 刚好 等 于 作业 的 大 小 。 可 变 分 区 分 配 需 要 两 种 管理 表格 ， 
其 中 已 分 配 表 记录 已 分 配 分 区 的 情况 ， 未 分 配 表 记 录 未 分 配 分 区 的 情况 。 

对 于 可 变 分 区 的 请 求 和 释放 分 区 主要 有 如 下 4 种 算法 。 

@ 最 佳 适应 算法 。 假 设 系统 中 有 nn 个 空白 区 (自由 区 )， 每 当 用 户 申请 一 个 空间 时 ， 将 从 
这 个 空白 区 中 找到 一 个 最 接近 用 户 需 求 的 分 区 。 这 种 算法 能 保留 较 大 的 空白 区 ， 缺 点 是 空前 
区 不 可 能 刚好 等 于 用 户 要 求 的 区 ， 所 以 必然 要 将 一 个 分 区 一 分 为 二 ， 但 是 随 着 系统 不 断 地 释放 
室 间 ， 可 能 会 使 产生 的 小 分 区 小 到 无 法 再 继续 分 配 ， 将 这 样 的 无 用 小 分 区 称 为 外 碎片 。 

@ 最 差 适 应 算法 。 系 统 总 是 将 用 户 作业 装 入 最 大 的 空白 分 区 。 这 种 算法 将 一 个 最 大 的 分 
区 一 分 为 二 ， 所 以 剩 下 的 空白 区 通常 也 大 ， 不 容易 产生 外 碎片 。 

@ 首次 适应 算法 。 每 当 用 户 作 业 申 请 一 个 空间 时 ， 系 统 总 是 从 主 存 的 低地 址 开始 选择 一 
个 能 装 入 作业 的 空白 区 。 当 用 户 释 放空 间 时 ， 该 算法 更 易 实现 相 邻 的 空白 区 合并 。 
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图 循环 首次 适应 算法 。 与 首次 适应 算法 的 不 同 之 处 是 ， 每 次 分 配 都 是 从 刚 分 配 的 空白 区 
开始 寻找 一 个 能 满足 用 户 要 求 的 空白 区 。 

引入 可 变 分 区 后 虽然 主 存 的 分 配 更 灵活 ， 也 提高 了 主 存 的 利用 率 ， 但 是 由 于 系统 在 不 断 地 
分 配 和 回收 中 ， 必 定 会 出 现 一 些 不 连续 的 小 的 空闲 区 ， 尽 管 这 些小 的 空闲 区 的 总 和 超过 某 一 个 
作业 要 求 的 空间 ， 但 是 由 于 不 连续 而 无 法 分 配 ， 产 生 了 未 分 配 区 的 无 用 空间 ， 通 常 称 之 为 外 碎 
片 。 解 决 碎片 的 方法 是 拼接 (或 称 紧凑 )， 即 向 一 个 方向 (例如 向 低地 址 端 》 移 动 已 分 配 的 作 
业 ， 使 那些 零散 的 小 空闲 区 在 另 一 个 方向 连 成 一 片 。 

(3) 可 重 定位 分 区 。 可 重 定位 分 区 是 解决 碎片 问题 的 简单 且 行 之 有 效 的 方法 。 基 本 思想 是 
移动 所 有 已 分 配 好 的 分 区 , 使 之 成 为 连续 区 域 。 如 同 队列 有 一 个 队员 出 列 , 指挥 员 要 求 大 家 “ 靠 
拢 ”一 样 。 分 区 “靠拢 ”的 时 机 是 当 用 户 请 求 空间 得 不 到 满足 时 或 某 个 作业 执行 完毕 时 。 由 于 
靠拢 是 要 代价 的 ， 所 以 通常 是 在 用 户 请 求 空间 得 不 到 满足 时 进行 。 需 要 注意 的 是 ， 当 进行 分 区 
“靠拢 ”时 会 导致 地 址 发 生变 化 ， 所 以 有 地 址 重 定位 问题 。 


2， 分 区 保护 


分 区 保护 的 目的 是 防止 未 经 核准 的 用 户 访问 分 区 ， 常 用 如 下 两 种 方式 。 

(1) 采用 上 界 /下 界 寄 存 器 保护 。 上 界 寄存 器 中 存放 的 是 作业 的 装 入 地 址 ， 下 界 寄存 器 中 装 
入 的 是 作业 的 结束 地 址 ， 形 成 的 物理 地 址 必须 满足 如 下 条 件 : 

上 界 寄存 器 < 物理 地 址 < 下 界 寄存 器 

(2) 采用 基 址 / 限 长 寄存 器 保护 。 基 址 寄存 器 中 存放 的 是 作业 的 装 入 地 址 ， 限 长 寄存 器 中 装 

入 的 是 作业 的 长 度 ， 形 成 的 物理 地 址 必须 满足 如 下 条 件 : 
基 址 寄存 器 < 物理 地 址 < 基 址 寄存 器 + 限 长 寄存 器 

4.3.3 分 页 存储 管理 


尽管 分 区 管理 方案 是 解决 多 道 程序 共享 主 存 的 可 行 方案 , 但 是 该 方案 的 主要 问题 是 用 户 程 
序 必须 装 入 连续 的 地 址 空间 中 ， 若 无 满足 用 户 要 求 的 连续 空间 ， 需 要 进行 分 区 靠拢 操作 ， 这 是 
以 耗费 系统 时 间 为 代价 的 。 为 此 ， 引 入 了 分 页 存储 管理 方案 。 


1.， 纯 分 页 存储 管理 


1) 分 页 原理 

将 一 个 进程 的 地 址 空间 划分 成 若干 个 大 小 相等 的 区 域 ， 称 为 页 。 相 应 地 ， 将 主 存 空 间 划分 
成 与 页 相同 大 小 的 若干 个 物理 块 ， 称 为 块 或 页 框 。 在 为 进程 分 配 主 存 时 ， 将 进程 中 若干 页 分 别 
装 入 多 个 不 相 邻 接 的 块 中 。 
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2) 地 址 结构 


分 页 系统 的 地 址 结构 如 图 4-16 所 示 ， 它 由 两 部 分 组 成 : 前 一 部 分 为 页 号 P; 后 一 部 分 为 偏 
移 量 瑚 即 页 内 地 址 。 图 中 的 地 址 长 度 为 32 位 ， 其 中 ，0 一 11 位 为 页 内 地 址 (每 页 的 大 小 为 
4kb)，12 一 31 位 为 页 号 ， 所 以 允许 地 址 空间 的 大 小 最 多 为 1Mb 个 页 。 


31 12 11 0 


图 4-16 分 页 地 址 结构 
3) 页 表 
当 进 程 的 多 个 页 面 离散 地 分 配 到 主 存 的 多 个 物理 块 时 ,系统 应 能 保证 在 主 存 中 找到 进程 要 
访问 的 页 面 所 对 应 的 物理 块 。 为 此 ， 系 统 为 每 个 进程 建立 了 一 张 页 面 映射 表 ， 简 称 页 表 (如 图 
4-17 所 示 )。 每 个 页 在 页 表 中 占 一 个 表 项 ， 记 录 该 页 在 主 存 中 对 应 的 物理 块 号 。 
页 表 始 址 寄存 器 页 表 长 度 寄存 器 页 号 页 内 地 址 


B 交 4 256 逻辑 地 址 


< 
i | 和 se meat 地 中 
0 [6] 
1 9 
3 11 
4 5 一 一 一 | 15 | 256 | 物理 地 址 
5 3 
6 18 


图 4-17 页 式 存储 管理 的 地 址 映射 


例如 ， 进 程 在 执行 时 ， 系 统 通过 查找 页 表 就 可 以 找到 每 页 所 对 应 的 物理 块 号 。 图 中 好 辑 页 
号 为 4， 查 找 页 表 可 得 该 页 的 物理 块 号 为 13， 与 页 内 地 址 256 拼接 得 到 物理 地 址 。 可 见 ， 页 表 
的 作用 是 实现 从 页 号 到 物理 块 号 的 地 址 映射 。 

地 址 变换 机 构 的 基本 任务 是 利用 页 表 把 用 户 程序 中 的 逻辑 地 址 变换 成 主 存 中 的 物理 地 址 ， 
实际 上 就 是 将 用 户 程序 中 的 页 号 变换 成 主 存 中 的 物理 块 号 。 为 了 实现 地 址 变换 功能 ， 在 系统 中 
设置 页 表 寄 存 器 ， 用 来 存放 页 表 的 始 址 和 页 表 的 长 度 。 在 进程 未 执行 时 ， 每 个 进程 对 应 的 页 表 
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的 始 址 和 长 度 存 放 在 进程 的 PCB 中， 当 该 进程 被 调度 时 ， 则 将 它们 装 入 页 表 寄存 器 。 在 进行 地 
址 变换 时 , 系统 将 页 号 与 页 表 长 度 进行 比较 , 如 果 页 号 大 于 等 于 页 表 寄存 器 中 的 页 表 长 度 世 (页 
号 从 0 开始 )， 则 访问 越界 ， 产 生 越 界 中 断 。 若 未 出 现 越界 ， 则 根据 页 表 寄 存 器 中 的 页 表 始 址 
和 页 号 计算 出 该 页 在 页 表 项 中 的 位 置 ， 得 到 该 页 的 物理 块 号 ， 将 此 物理 块 号 装 入 物理 地 址 寄存 
器 中 。 与 此 同时 ， 将 有 效 地址 〈 罗 辑 地 址 ) 寄存 器 中 页 内 地 址 直接 装 入 物理 地 址 寄存 器 的 块 内 
地 址 字段 中 ， 这 样 便 完成 了 从 逻辑 地 址 到 物理 地 址 的 变换 。 


2. 快 表 


从 地 址 映射 的 过 程 可 以 发 现 ， 页 式 存储 管理 至 少 需 要 两 次 访问 主 存 。 例 如 ， 第 一 次 是 访问 
页 表 ， 得 到 的 是 数据 的 物理 地 址 ， 第 二 次 是 存 取 数 据 ， 若 该 数据 是 间接 地 址 ， 还 需要 再 进行 地 
址 变换 ， 再 存 取 数据 ， 显 然 访 问 主 存 的 次 数 大 于 2。 为 了 提高 访问 主 存 的 速度 ， 可 以 在 地 址 映 
射 机 构 中 增加 一 组 高 速 寄存 器 ， 用 来 保存 页 表 。 这 种 方法 需要 大 量 的 硬件 开销 ， 在 经 济 上 是 不 
可 行 的 。 另 一 种 方法 是 在 地 址 映射 机 构 中 增加 一 个 小 容量 的 联想 存储 器 ， 联 想 存储 器 由 一 组 高 
速 存储 器 组 成 ， 称 之 为 快 表 ， 用 来 保存 当前 访问 频率 高 的 少数 活动 页 的 页 号 及 相关 信息 。 

联想 存储 器 存放 的 只 是 当前 进程 最 活跃 的 少数 几 页 的 物理 块 号 , 这 样 用 户 程序 要 访问 数据 
时 ， 系 统 根据 数据 的 逻辑 页 号 在 联想 存储 器 中 找 出 对 应 的 物理 块 号 ， 然 后 与 页 内 地 址 拼接 形成 
物理 地 址 ; 若 找 不 到 ， 则 地 址 映射 仍 通过 主 存 的 页 表 进行 ， 得 到 物理 地 址 后 ， 需 将 物理 块 号 填 


入 联想 存储 器 的 空闲 单元 中 ， 若 无 空闲 单元 ， 则 根据 淘汰 算法 淘汰 某 一 页 ， 再 填 入 新 得 到 的 页 
号 。 事 实 上 ， 查 找 联想 存储 器 和 查找 主 存 页 表 是 并 行进 行 的 ， 一 旦 在 联想 存储 器 中 找到 相符 的 


逻辑 页 号 ， 就 停止 查找 主 存 页 表 。 
3， 两 级 页 表 机 制 


大 家 知道 ，80386 的 逻辑 地 址 有 2” 个 ， 若 页 面 大 小 为 4kb (22B)， 则 页 表 项 达 1Mb 个 ， 
每 个 页 表 项 占用 4B， 故 每 个 进程 的 页 表 占 用 4Mb 主 存 空间 ， 并 且 还 要 求 是 连续 的 ， 显 然 这 是 
不 现实 的 。 为 了 减少 页 表 所 占用 的 连续 的 主 存 空 间 ， 在 80386 中 采用 了 两 级 页 表 机 制 。 基 本 方 
法 是 将 页 表 进 行 分 页 ， 每 个 页 面 的 大 小 与 主 存 物 理 块 的 大 小 相同 ， 并 为 它们 进行 编号 ， 可 以 离 
散 地 将 各 个 页 面 分 别 存放 在 不 同 的 物理 块 中 。 为 此 需要 建立 一 张 页 表 ， 称 为 外 层 页 表 《〈 页 表 目 
录 )， 即 第 一 级 是 页 目录 表 ， 其 中 的 每 个 表 目 是 存放 某 个 页 表 的 物理 地 址 ; 第 二 级 是 页 表 ， 其 
中 的 每 个 表 目 所 存放 的 是 页 的 物理 块 号 。 

两 级 页 表 的 逻辑 地 址 结构 和 两 级 页 表 的 地 址 变换 机 构 如 图 4-18 所 示 。 
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虚拟 地 址 
[外 层 页 号 P| 外 层 页 内 地 址 B 页 内 地 址 4 


外 层 页 表 寄 存 器 一 | 


四 
| 


图 4-18 两 级 页 表 的 地 址 变换 机 构 


4.3.4 “分 段 存储 管理 


在 分 段 存储 管理 方式 中 ， 作 业 的 地 址 空间 被 划分 为 若干 个 段 ， 每 个 段 是 一 组 完整 的 逻辑 信 
息 ， 例 如 有 主 程序 段 、 子 程序 段 、 数 据 段 及 堆栈 段 等 ， 每 个 段 都 有 自己 的 名 字 ， 都 是 从 0 开始 
编 址 的 一 段 连续 的 地 址 空间 ， 各 段 的 长 度 是 不 等 的 。 分 段 系 统 的 地 址 结构 如 图 4-19 所 示 ， 风 辑 
地 址 由 段 号 (名 〉 和 有 段 内 地 址 两 部 分 组 成 。 在 该 地 址 结构 中 ， 允 许 一 个 作业 最 多 有 64 kb 个 段 ， 


每 个 段 的 最 大 长 度 为 64 kb。 
31 16 15 0 


图 4-19 分 段 的 地 址 结构 


在 分 段 式 存储 管理 系统 中 ， 为 每 个 段 分 配 一 个 连续 的 分 区 ， 而 进程 中 的 各 个 段 可 以 离散 地 
分 配 到 主 存 的 不 同 分 区 中 。 在 系统 中 为 每 个 进程 建立 一 张 段 映射 表 ， 简 称 为 “ 段 表 ”。 每 个 段 
在 表 中 占有 一 个 表 项 ， 在 其 中 记录 了 该 段 在 主 存 中 的 起 始 地 址 〈 又 称 为 “ 基 址 >) 和 有 段 的 长 度 ， 
如 图 4-20 所 示 。 进 程 在 执行 时 ， 通 过 查 段 表 来 找到 每 个 段 所 对 应 的 主 存 区 。 可 见 ， 段 表 实现 了 
从 他 辑 段 到 物理 主 存 区 的 映射 。 

为 了 实现 从 逻辑 地 址 到 物理 地 址 的 变换 功能 ,系统 中 设置 了 段 表 寄存 器 ， 用 于 存放 段 表 始 
址 和 上 段 表 长 度 ,在 进行 地 址 变换 时 , 系统 将 逻辑 地 址 中 的 段 号 8 与 段 表 长 度 工 进行 比较 。 若 S>L， 
表示 段 号 太 大 ， 访 问 越 界 ， 于 是 产生 越界 中 断 信号 ; 若 未 越界 ， 则 根据 段 表 的 始 址 和 该 段 的 段 
号 ， 计 算出 该 段 对 应 段 表 项 的 位 置 ， 从 中 读 出 该 段 在 主 存 中 的 起 始 地 址 ， 然 后 再 检查 段 内 地 址 
4d 是 否 超过 该 段 的 段 长 SL。 若 超过 ， 即 4>SL， 同 样 发 出 越界 中 断 信号 ; 若 未 越界 ， 则 将 该 段 的 
基 址 5 与 段 内 地 址 4 相 加 ， 得 到 要 访问 的 主 存 物理 地 址 。 
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段 表 寄存 器 地 址 越界 逻辑 地 址 
段 表 起 始 地 址 | 段 表 长 度 段 号 5 |[ 段 内 地 址 4 
段 号 S 段 长 / 基 址 
0 
, 
2 d 
> | 物理 地 址 


图 4-20 段 式 存储 管理 的 地 址 变换 机 构 
【 例 4.9】 系统 采用 段 式 存储 管理 方案 ， 假 设 某 作业 的 段 表 如 下 : 


(1) 逻辑 地 址 (0，168)、(1，58)、(2，98)、(3，300) 和 “4，100) 能 否 转换 为 对 应 的 
物理 地 址 ? 为 什么 ? 

(2) 将 问题 (1) 的 逻辑 地 址 分 别 转换 成 对 应 的 物理 地 址 。 

解 : 
(1) 迎 辑 地 址 (0，168)、(1，58)、(2，98) 和 (3，300) 可 以 转换 成 对 应 的 物理 地 址 ， 
而 旭 辑 地 址 〈4，100) 不 能 转换 为 对 应 的 物理 地 址 ， 因 为 地 址 越界 。 

(2) 逻辑 地 址 (0，168〉 对 应 的 物理 地 址 是 219+168=387; 

逻辑 地 址 (1，58) 对 应 的 物理 地 址 是 2300+58=2358; 

逻辑 地 址 (2，98) 对 应 的 物理 地 址 是 90+98=188; 

逻辑 地 址 (3，300) 对 应 的 物理 地 址 是 1327+300=1627。 


4.3.5 段 页 式 存储 管理 


分 页 和 分 段 存储 管理 方式 各 有 其 优 缺 点 。 因 为 分 页 的 过 程 是 由 操作 系统 完成 的 ， 对 用 户 是 
透明 的 ， 所 以 用 户 不 必 关 心 分 页 的 过 程 ， 其 缺点 是 不 易 实 现 共享 ， 段 是 信息 的 逻辑 单位 ， 其 优 
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点 是 易于 实现 段 的 共享 ， 即 允许 若干 个 进程 共享 一 个 或 多 个 段 ， 而 且 对 段 的 保护 也 十 分 简单 。 
如 果 对 两 种 存储 管理 方式 “各 取 所 长 ” 则 可 以 形成 一 种 新 的 存储 管理 方式 的 系统 “ 段 页 式 系 
统 ”。 这 种 新 系统 既 具 有 分 页 系统 能 有 效 地 提高 主 存 利 用 率 的 优点 ， 又 具有 分 段 系 统 能 很 好 地 
满足 用 户 需 要 的 长 处 ， 显 然 是 一 种 比较 有 效 的 存储 管理 方式 。 

段 页 式 系统 的 基本 原理 是 先 将 整个 主 存 划分 成 大 小 相等 的 存储 块 〈 页 框 )， 将 用 户 程序 按 
程序 的 逻辑 关系 分 为 若干 个 段 ， 并 为 每 个 段 赋予 一 个 段 名 ， 再 将 每 个 段 划 分 成 若干 页 ， 以 页 框 
为 单位 离散 分 配 。 在 段 页 式 系统 中 ， 其 地 址 结构 由 段 号 、 段 内 页 号 和 页 内 地 址 三 部 分 组 成 。 作 
业 地 址 空间 的 结构 如 图 4-21 所 示 。 


段 号 s 段 内 页 号 p 页 内 地 址 w 


图 4-21 段 页 式 管理 的 地 址 结构 


在 段 页 式 系统 中 ,为 了 实现 从 逻辑 地 址 到 物理 地 址 的 变换 ， 系 统 中 必须 同时 配置 段 表 和 页 
表 。 由 于 将 段 中 的 页 进行 离散 地 分 配 ， 段 表 中 的 内 容 不 再 是 段 的 主 存 始 址 和 段 长 ， 而 是 页 表 始 
址 和 页 表 长 度 。 在 段 页 式 系统 中 有 一 个 段 表 寄存 器 ,用 于 存放 段 表 起 始 地 址 和 段 表 长 度 7L， 其 
地 址 变换 结构 如 图 4-22 所 示 。 


段 表 寄 存 器 地 址 越界 逻辑 地 址 


段 表 起 始 地 址 | 段 胡 长 度 7 | 段 号 9 | 页 SP | Ws 
1 > 
+ 
段 表 页 表 
0 一 人 
1 b W 
s 物理 地 址 


图 4-22 段 页 式 存储 管理 的 地 址 变换 结构 


上 mb 一 口 


在 段 页 式 系统 中 逻辑 地 址 到 物理 地 址 的 变换 过 程 如 下 : 
(1) 根据 段 号 8 查 段 表 ， 得 到 页 表 的 起 始 地 址 ; 

(2) 根据 页 号 己 查 页 表 ， 得 到 物理 块 号 b; 

(3) 将 物理 块 号 5 拼 页 内 地 址 更 得 到 物理 地 址 。 
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4.3.6 ”虚拟 存储 管理 


在 前 面 介绍 的 存储 管理 方案 中 ， 必 须 为 每 个 作业 分 配 足够 的 空间 ， 以 便装 入 全 部 信息 。 当 
主 存 空间 不 能 满足 作业 要 求 时 ， 作 业 无 法 装 入 主 存 执行 。 

如 果 一 个 作业 只 部 分 装 入 主 存 便 可 开始 启动 运行 ， 其 余部 分 暂时 留 在 磁盘 上 ， 在 需要 时 再 
装 入 主 存 ， 这 样 可 以 有 效 地 利用 主 存 空间 。 从 用 户 角度 看 ， 该 系统 所 具有 的 主 存 容 量 将 比 实际 
主 存 容量 大 得 多 ， 人 们 把 这 样 的 存储 器 称 为 虚拟 存储 器 。 虚 拟 存储 器 是 为 了 扩大 主 存 容量 而 采 
用 的 一 种 设计 方法 ， 其 容量 是 由 计算 机 的 地 址 结构 决定 的 。 

1. 程序 局 部 性 原理 


早 在 1968 年 PDenning 就 指出 ， 程 序 在 执行 时 将 呈现 出 局 部 性 规律 ， 即 在 一 段 时 间 内 ， 程 
序 的 执行 仅 局 限于 某 个 部 分 。 相 应 地 ， 它 所 访问 的 存储 空间 也 局 限于 某 个 区 域内 。 程 序 的 局 限 
性 表现 在 时 间 局 限 性 和 空间 局 限 性 两 个 方面 。 

(1) 时 间 局 限 性 是 指 如 果 程序 中 的 某 条 指令 一 旦 执行 ， 则 不 久 的 将 来 该 指令 可 能 再 次 被 执 
行 ， 如果 某 个 存储 单元 被 访问 ， 则 不 和 久 以 后 该 存储 单元 可 能 再 次 被 访问 。 产 生 时 间 局 限 性 的 典 
型 原因 是 在 程序 中 存在 着 大 量 的 循环 操作 。 

(2) 空间 局 限 性 是 指 一 旦 程序 访问 了 某 个 存储 单元 ， 则 在 不 久 的 将 来 ， 其 附近 的 存储 单元 
也 最 有 可 能 被 访问 。 即 程序 在 一 段 时 间 内 所 访问 的 地 址 可 能 集中 在 一 定 的 范围 内 ， 其 典型 原因 
为 程序 是 顺序 执行 的 。 


2. 虚拟 存储 器 的 实现 


虚拟 存储 器 是 具有 请 求 调 入 功能 和 置换 功能 ， 能 仅 把 作业 的 一 部 分 装 入 主 存 便 可 运行 作业 
的 存储 器 系统 ， 是 能 从 惕 辑 上 对 主 存 容量 进行 扩充 的 一 种 虚拟 的 存储 器 系统 。 其 逻辑 容量 由 了 
存 和 外 存 容量 之 和 以 及 CPU 可 寻 址 的 范围 来 决定 ， 其 运行 速度 接近 于 主 存 速度 ， 成 本 也 下 降 。 
可 见 ， 虚 拟 存储 技术 是 一 种 性 能 非常 优越 的 存储 器 管理 技术 ， 故 被 广泛 地 应 用 于 大 、 中 、 小 型 
机 器 和 微型 机 中 。 虚 拟 存储 器 的 实现 主要 有 如 下 3 种 方式 。 

(1) 请 求 分 页 系统 。 该 系统 是 在 分 页 系统 的 基础 上 增加 了 请 求 调 页 功能 和 页 面 置换 功能 所 
形成 的 页 式 虚拟 存储 系统 。 它 允许 只 装 入 若干 页 的 用 户 程序 和 数据 (而 非 全 部 程序 ) 就 可 以 启 
动 运行 ， 以 后 再 通过 调 页 功能 和 页 面 置换 功能 陆续 把 将 要 使 用 的 页 面 调 入 主 存 ， 同 时 把 暂 不 运 
行 的 页 面 置换 到 外 存 上 ， 置 换 时 以 页 面 为 单位 。 

(2) 请 求 分 段 系 统 。 该 系统 是 在 分 段 系 统 的 基础 上 增加 了 请 求 调 段 和 分 段 置 换 功 能 所 形成 
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的 段 式 虚拟 存储 系统 。 它 允许 只 装 入 若干 段 的 用 户 程序 和 数据 就 可 以 启动 运行 ， 以 后 再 通过 调 
段 功 能 和 置换 功能 将 不 运行 的 段 调 出 ， 同 时 调 入 将 要 运行 的 段 ， 注 意 : 置换 时 以 段 为 单位 。 

(3) 请 求 段 页 式 系统 。 该 系统 是 在 段 页 式 系统 的 基础 上 增加 了 请 求 调 页 和 页 面 置换 功能 所 
形成 的 段 页 式 虚拟 存储 系统 。 


3. 请 求 分 页 管理 的 实现 


请 求 分 页 是 在 纯 分 页 系统 的 基础 上 增加 了 请 求 调 页 功能 、 页面 置换 功能 所 形成 的 页 式 虚 拟 
存储 系统 ， 它 是 目前 常用 的 一 种 虚拟 存储 器 的 方式 。 

请 求 分 页 的 页 表 机 制 是 在 纯 分 页 的 页 表 机 制 上 形成 的 ， 由 于 只 将 应 用 程序 的 一 部 分 调 入 主 
存 ,还 有 一 部 分 仍 在 磁盘 上 ， 故 需 在 页 表 中 再 增加 若干 项 (如 状态 位 、 访 问 字段 和 辅 存 地 址 等 
供 程序 (数据 ) 在 换 进 、 换 出 时 参考 。 

请 求 分 页 系统 中 的 地 址 变换 机 构 是 在 分 页 系统 的 地 址 变换 结构 的 基础 上 增加 了 某 些 功能 ， 
如 产生 和 处 理 缺 页 中 断 、 从 主 存 中 换 出 一 页 实现 虚拟 存储 。 

在 请 求 分 页 系统 中 ， 每 当 所 要 访问 的 页 面 不 在 主 存 时 便 要 产生 一 个 缺 页 中 断 ， 请 求 OS 将 
所 缺 的 页 调 入 主 存 ， 这 是 由 缺 页 中 断 机 构 完 成 的 。 缺 页 中 断 与 一 般 中 断 的 主要 区 别 如 下 。 

(1) 缺 页 中 断 在 指令 执行 期 间 产 生 和 处 理 中 断 信 号 ， 而 一 般 中 断 在 一 条 指令 执行 完 ， 下 一 
条 指令 开始 执行 前 检查 和 处 理 中 断 信 号 。 

(2) 发 生 缺 页 中 断 时 ， 返 回 到 被 中 断 指 令 的 开始 重新 执行 该 指令 ， 而 一 般 中 断 返 回 到 下 一 
条 指令 执行 。 

(3) 一 条 指令 在 执行 期 间 可 能 会 产生 多 次 缺 页 中 断 。 

【 例 4.10】 在 某 计 算 机 中 ， 假 设 某 程序 的 COPY 指令 跨 两 个 页 面 ， 且 源 地 址 A 和 目标 地 
址 B 所 涉及 的 区 域 也 跨 两 个 页 面 ， 如 下 图 所 示 。 


页 号 


车 地 址 为 A 和 B 的 操作 数 均 不 在 内 存 ， 计 算 机 执行 COPY 指令 时 ， 系 统 将 产生 (1) 缺 
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页 中 断 ; 车 系统 产生 3 次 缺 页 中 断 ， 那 么 该 程序 有 _〈2》 个 页 面 在 内 存 。 


(1) A.2 Bs C. 4 D3 
(2) A. 2 B33 C.4 Di:3 
例题 分 析 


从 例题 的 图 中 可 以 看 到 ， 程 序 的 COPY 指令 跨 两 个 页 面 ， 且 源 地 址 A 和 目标 地 址 B 所 涉 
及 的 区 域 也 跨 两 个 页 面 页 内 地 址 ， 这 时 ， 如果 2、3、4 和 5 号 页 面 不 在 内 存 ， 系 统 执行 “COPY 
ATOB” 指令 时 , 取 地 址 为 A 的 操作 数 。 由 于 该 操作 数 不 在 内 存 且 跨 两 个 页 面 2、3, 需要 将 2、 
3 页 面 装 入 内 存 ， 所 以 产生 两 次 缺 页 中 断 。 同 理 ， 取 地 址 为 B 的 操作 数 ， 由 于 该 操作 数 不 在 内 
存 且 跨 两 个 页 面 4 和 S$， 需 要 将 4 和 5 页 面 装 入 内 存 ， 所 以 产生 两 次 缺 页 中 断 ， 共 产生 4 次 缺 
页 中 断 。 故 例题 空 (1) 的 正确 答案 为 C。 

同 理 ， 如 果 1、2、3 号 页 面 不 在 内 存 ， 系 统 执行 “COPY A TO B” 指 令 时 ， 由 于 程序 的 
COPY 指令 跨 两 个 页 面 ， 当 取出 指令 分 析 是 多 字 节 的 ， 那 么 系统 将 产生 一 次 缺 页 中 断 取 指 令 的 
后 半 部 分 ， 当 取 地 址 为 A 的 操作 数 ， 由 于 该 操作 数 不 在 内 存 ， 且 跨 两 个 页 面 2 和 3， 需要 将 2 
和 3 页 面 装 入 内 存 ， 所 以 产生 两 次 缺 页 中 断 ， 共 产生 3 次 缺 页 中 断 。 故 例题 空 (2) 的 正确 答 
案 为 B。 


4. 页 面 置 换算 法 


请 求 分 页 是 在 纯 分 页 系统 的 基础 上 增加 了 请 求 调 页 功能 、 页面 置 换 功 能 所 形成 的 页 式 虚拟 
存储 系统 ， 它 是 目前 常用 的 一 种 虚拟 存储 器 的 方式 。 在 进程 运行 过 程 中 ， 如 果 发 生 缺 页 ， 此 时 
主 存 中 又 无 室 闲 块 时 ， 为 了 保证 进程 能 正常 运行 ， 必 须 从 主 存 中 调 出 一 页 程序 或 数据 送 磁盘 的 
对 换 区 。 但 究竟 将 哪个 页 面 调 出 ， 需 要 根据 一 定 的 页 面 置换 算法 来 确定 。 置 换算 法 的 好 坏 将 直 
接 影 响 系统 的 性 能 ， 不 适当 的 算法 可 能 会 导致 系统 发 生 “抖动 ”(CThrashing)。 即 刚 被 换 出 的 页 
很 快 又 被 访问 ， 需 重新 调和 入， 导致 系统 频繁 地 更 换 页 面 ， 以 至 于 一 个 进程 在 运行 中 把 大 部 分 时 
间 花 费 在 完成 页 面 置 换 的 工作 上 ， 这 种 现象 称 为 系统 发 生 了 “抖动 ”( 也 称 颠 艇 )。 请 求 分 页 系 
统 的 核心 问题 是 选择 合适 的 页 面 署 换 算法， 常用 的 页 面 置换 算法 如 下 所 述 。 

1) 最 佳 COptimal) 置换 算法 

这 是 一 种 理想 化 的 算法 ， 即 选择 哪些 是 永 不 使 用 的 ， 或 者 是 在 最 长 时 间 内 不 再 被 访问 的 页 
面 署 换 出 去 。 这 种 方法 性 能 最 好 ， 但 实际 上 难于 实现 。 并 且 要 确定 哪 一 个 页 面 是 未 来 最 长 时 间 
内 不 再 被 访问 的 是 很 难 的 ， 所 以 该 算法 通常 用 来 评价 其 他 算法 。 

【 例 4.11】 假定 系统 为 进程 P1 分 配 了 3 个 物理 块 ， 该 进程 访问 页 面 的 顺序 为 “0，7，6， 
5，7，4，7，3，5，4，7，4，5，6，5，7，6，0，7，6”， 利 用 最 佳 置换 算法 的 结果 如 图 4-23 
所 示 ， 图 中 x 表示 产生 缺 页 中 断 。 求 缺 页 中 断 次 数 、 页 面 置换 次 数 和 缺 页 率 。 
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访问 面 | o | 7 | 5|5 


7|4|7|3|5|4|7|4|s|sls|7|slol7|s 
物 |oljoljol5l5|lsls|lsls|ljs|ljs|lsljs|s|5|5|5s|joljolo 
理 辐 克 大 吏 贺 加 本 吏 西 酚 加 本 画 四 本 匠 
块 同 下 加 琴 殉 罗 四 | 四 友 加 本 | 肥 直 本 可 号 可 吴 天 达到 克 到 达到 到 
缺 页 |x|x|x|x X X X x| | | [xj| 


图 4-23 最 佳 置 换算 法 


例题 分 析 : 根据 题 意 系统 为 Pl 分 配 了 3 个 物理 块 ， 故 Pl 开始 运行 申请 的 0、7、6 三 个 页 
面 将 产生 缺 页 中 断 ， 但 不 需要 置换 页 面 ( 因 为 刚 开始 分 配 的 内 存 物 理 块 “空闲 ”)， 当 进程 访问 
页 面 5 时 产生 缺 页 中 断 ， 由 于 页 面 0 将 在 第 18 次 才 被 访问 ， 根 据 最 佳 置换 算法 0、7、6 三 页 
中 0 页 将 最 久 不 被 访问 的 页 面 ， 所 以 被 淘汰 ， 接 着 访问 页 面 7， 发 现 已 在 主 存 中 ， 不 会 产生 缺 


页 中 断 ， 依 此 类 推 。 


从 上 分 析 可 知 ， 采 用 最 佳 置换 算法 产生 了 9 次 缺 页 中 断 ， 发 生 了 6 次 页 面 置 换 (前 3 次 无 


需 页面 置 换 )， 缺 页 率 . 广 缺 页 次 数 /访问 次 数 =9/20=45%。 
2) 先进 先 出 〈FIFO) 置换 算法 


该 算法 总 是 淘汰 最 先进 入 主 存 的 页 面 ， 即 选择 在 主 存 中 驻 留 时 间 最 久 的 页 面 予 以 淘汰 。 该 
算法 实现 简单 ， 只 需 把 一 个 进程 调 入 主 存 的 页 面 ， 按 先后 次 序 链接 成 一 个 队列 ， 并 设置 一 个 指 
针 即 可 。 它 是 一 种 最 直观 、 性 能 最 差 的 算法 ， 有 Belady 异常 现象 。 所 谓 Belady 现象 ， 是 指 如 
果 对 一 个 进程 未 分 配 它 所 要 求 的 全 部 页 面 ， 有 时 就 会 出 现 分 配 的 页 面 数 增多 但 缺 页 率 反 而 提高 
的 异常 现象 。 例 如 ， 对 于 页 面 访 问 序列 “1，2，3，4，1，2，5，1，2，3，4，5”， 当 分 配 的 


物理 块 从 3 块 增加 到 4 块 时 ， 有 缺 页 次 数 增加 、 缺 页 率 提高 的 异常 现象 。 


【 例 4.12】 假定 系统 中 某 进程 访问 页 面 的 顺序 为 “0，7，6，5，7，4，7，3，5，4，7，4， 


5，6，5，7，6，0，7，6”， 利 用 FIFO 算法 对 上 例 进行 页 面 置换 的 结果 如 图 4-24 所 示 。 
7 | 


图 4-24 ”先进 先 出 置换 算法 


分 析 略 。 从 图 中 可 见 ， 发 生 了 14 次 缺 页 中 断 ， 页 面 置换 11 次 ， 缺 页 率 广 14/20=70%。 
3) 最 近 最 少 未 使 用 (LeastRecently Used，LRU) 置换 算法 


该 算法 是 选择 最 近 最 少 未 使 用 的 页 面 予 以 淘汰 ， 系 统 在 每 个 页 面 设置 一 个 访问 字段 ， 用 于 


记录 这 个 页 面 自 上 次 被 访问 以 来 所 经 历 的 时 间 7， 当 要 淘汰 一 个 页 面 时 ， 选 择 了 最 大 的 页 面 ， 
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但 在 实现 时 需要 硬件 的 支持 〈 寄 存 器 或 栈 )。 
【 例 4.13】 假定 系统 中 某 进 程 访 问 页 面 的 顺序 为 “0，7，6，5，7，4，7，3，5，4，7，4， 
5，6，5，7，6，0，7，6” 利用 LRU 算法 对 上 例 进行 页 面 置换 的 结果 如 图 4-25 所 示 。 


图 4-25 最 近 最 少 未 使 用 置换 算法 


分 析 略 。 从 图 中 可 见 ， 发 生 了 13 次 缺 页 中 断 ， 页 面 置换 10 次 ， 缺 页 率 . 广 13/20=65%。 

4) 最 近 未 用 (Not Used Recently，NUR) 置换 算法 

NUR 算法 将 最 近 一 段 时 间 未 引用 过 的 页 面 换 出 ， 这 是 一 种 LRU 的 近似 算法 。 该 算法 为 每 
个 页 面 设置 一 位 访问 位 ， 将 主 存 中 的 所 有 页 面 都 通过 链接 指针 链 成 一 个 循环 队列 。 当 某 页 被 访 
问 时 ,其 访问 位 置 1。 在 选择 一 页 淘汰 时 ,检查 其 访问 位 ， 如 果 是 0， 则 选择 该 页 换 出 ; 若 为 1， 
则 重新 置 为 0， 暂 不 换 出 该 页 ， 在 循环 队列 中 检查 下 一 个 页 面 ， 直 到 访问 位 为 0 的 页 面 为 止 。 
由 于 该 算法 只 有 一 位 访问 位 ， 只 能 用 它 表 示 该 页 是 否 已 经 使 用 过 ， 而 置换 时 是 将 未 使 用 过 的 页 
面 换 出 去 ， 所 以 把 该 算法 称 为 最 近 未 用 算法 。 

5. 工作 集 


事实 上 , 程序 在 运行 中 所 产生 的 缺 页 情况 会 影响 程序 的 运行 速度 及 系统 性 能 ， 而 缺 页 率 的 
高 低 又 与 每 个 进程 所 占用 的 物理 块 数目 有 关 。 那 么 ， 究 竟 应 该 为 每 个 进程 分 配 多 少 个 物理 块 才 
能 把 缺 页 率 保持 在 一 个 合理 的 水 平 上 ? 和 否则 会 因为 进程 频繁 地 从 辅 存 请 求 页 面 而 出 现 “ 颠 艇 ” 
(也 称 拌 动 ) 现象 。 为 了 解决 这 一 问题 ， 引 入 了 工作 集 理论 。 

工作 集 的 理论 是 1968 年 由 Denning 提出 的 ， 他 认为 ， 虽 然 程序 只 需 有 少量 的 几 页 在 主 存 
就 可 以 运行 ， 但 为 了 使 程序 能 够 有 效 地 运行 ， 较 少 地 产生 缺 页 ， 必 须 使 程序 的 工作 集 驻 留 在 主 
存 中 。 把 某 进 程 在 时 间 1 的 工作 集 记 为 w(t, A ), 变量 A 称 为 工作 集 “ 窗 口 尺寸 (Windows Size)”。 
正确 地 选择 工作 集 窗口 (A ) 的 大 小 ， 对 存储 器 的 有 效 利 用 和 系统 吞吐 量 的 提高 都 将 产生 重大 
的 影响 。 可 见 工作 集 就 是 指 在 某 段 时 间 间 隔 〈A ) 里 进程 实际 要 访问 的 页 面 的 集合 。 

程序 在 运行 时 对 页 面 的 访问 是 不 均匀 的 , 即 往往 在 某 段 时 间 内 的 访问 仅 局 限于 较 少 的 若干 
个 页 面 ， 如 果 能 够 预知 程序 在 某 段 时 间 间 隔 内 要 访问 哪些 页 面 ， 并 能 将 它们 提前 调 入 主 存 ， 将 
会 大 大 地 降低 缺 页 率 ， 从 而 减少 置换 工作 ， 提 高 CPU 的 利用 率 。 当 每 个 工作 集 都 已 达到 最 小 


国 216 若 。 软 人 设计 师 教程 (第 5 版 ) 


值 时 ， 虚 存 管理 程序 跟踪 进程 的 缺 页 数量 ， 根 据 主 存 中 自由 页 面 的 数量 可 以 适当 增加 其 工作 集 
的 大 小 。 


4.4 设备 管理 


设备 管理 是 操作 系统 中 最 繁杂 而 且 与 硬件 紧密 相关 的 部 分 。 设 备 管理 不 仅 要 管理 实际 IO 
操作 的 设备 (如 键盘 、 鼠 标 、 打 印 机 等 )， 还 要 管理 诸如 设备 控制 器 、 DMA 控制 器 、 中 断 控 制 
器 和 IO 处 理 机 (通道 ) 等 支持 设备 。 设 备 管理 包括 各 种 设备 分 配 、 缓 冲 区 管理 和 实际 物理 IO 
设备 操作 ， 通 过 管理 达到 提高 设备 利用 率 和 方便 用 户 的 目的 。 

4.4.1 设备 管理 概述 


设备 是 计算 机 系统 与 外 界 交 互 的 工具 , 具体 负责 计算 机 与 外 部 的 输入 /输出 工作 , 所 以 常 称 
为 外 部 设备 (简称 外 设 )。 在 计算 机 系统 中 ， 将 负责 管理 设备 和 输入 /输出 的 机 构 称 为 IO 系统 。 
因此 ，IO 系统 由 设备 、 控 制 器 、 通 道具 有 通道 的 计算 机 系统 )、 总 线 和 IO 软件 组 成 。 


1， 设备 的 分 类 


现代 计算 机 系统 都 配 有 各 种 各 样 的 设备 ， 如 打印 机 、 显 示 器 、 绘 图 仪 、 扫 描 仪 、 键 盘 和 鼠 
标 等 。 设 备 可 以 有 各 种 不 同 的 分 类 方式 。 

(1) 按 数据 组 织 分 类 。 分 为 块 设备 (Block Device) 和 字符 设备 (Character Device)。 块 设 
备 是 指 以 数据 块 为 单位 来 组 织 和 传送 数据 信息 的 设备 ， 如 磁盘 。 字 符 设备 是 指 以 单个 字符 为 单 
位 来 传送 数据 信息 的 设备 ， 如 交互 式 终端 、 打 印 机 等 。 

(2) 按照 设备 的 功能 分 类 。 分 为 输入 设备 、 输 出 设备 、 存 储 设备 、 网 络 联网 设备 、 供 电 设 
备 等 等 。 输入 设备 是 将 数据 、 图 像 、 声 音 送 入 计算 机 的 设备 ; 输出 设备 是 将 加 工 好 的 数据 显示 、 
印 制 、 再 生出 来 的 设备 ， 存 储 设备 是 指 能 进行 数据 或 信息 保存 的 设备 ， 网 络 联网 设备 是 指 网 络 
互 连 设 备 以 及 直接 连接 上 网 的 设备 ;供电 设备 是 指向 计算 机 提供 电力 能 源 、 电 池 后 备 的 部 件 与 
设备 ， 如 开关 电源 、 联 机 UPS 等 。 

(3) 从 资源 分 配角 度 分 类 。 分 为 独占 设备 、 共 享 设备 和 虚拟 设备 。 独 占 设 备 是 指 在 一 段 时 
间 内 只 允许 一 个 用 户 ( 进 程 ) 访问 的 设备 ， 大 多 数 低速 的 IO 设备 (如 用 户 终 端 、 打 印 机 等 ) 
属于 这 类 设备 。 共 享 设备 是 指 在 一 段 时 间 内 人 允许 多 个 进程 同时 访问 的 设备 。 显 然 ， 共 享 设备 必 
须 是 可 寻 址 的 和 可 随机 访问 的 设备 。 典 型 的 共享 设备 是 磁盘 。 虚 拟 设备 是 指 通过 虚拟 技术 将 一 
台独 占 设 备 变换 为 若干 台 供 多 个 用 户 〈 进 程 ) 共享 的 逻辑 设备 。 一 般 可 以 利用 假 脱 机 技术 
(Spooling 技术 ) 实现 虚拟 设备 。 
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(4) 按 数 据 传输 率 分 类 。 分 为 低速 设备 、 中 速 设备 和 高 速 设 备 。 低 速 设备 是 指 传输 速率 为 
每 秒 钟 几 个 字 节 到 数 百 个 字 节 的 设备 ， 典 型 的 设备 有 键盘 、 鼠 标 、 语 音 的 输入 等 。 中 速 设备 是 
指 传输 速率 在 每 秒 钟 数 千 个 字 节 到 数 十 千 个 字 节 的 设备 ， 典 型 的 设备 有 行 式 打印 机 、 激 光 打印 
机 等 。 高 速 设备 是 指 传输 速率 在 每 秒 数 百 千 个 字 节 到 数 兆 字 节 的 设备 ， 典 型 的 设备 有 磁带 机 、 
磁盘 机 和 光盘 机 等 。 


2. 设备 管理 的 目标 与 任务 


设备 管理 的 目标 主要 是 如 何 提高 设备 的 利用 率 ， 为 用 户 提 供 方便 、 统 一 的 界面 。 提 高 设备 
的 利用 率 ， 就 是 提高 CPU 与 IO 设备 之 间 的 并 行 操作 程度 。 在 设备 管理 中 ， 主 要 利用 的 技术 有 
中 断 技术 、DMA 技术 、 通 道 技术 和 缓冲 技术 。 

设备 管理 的 任务 是 保证 在 多 道 程序 环境 下 ， 当 多 个 进程 竞争 使 用 设备 时 ， 按 一 定 的 策略 分 
配 和 管理 各 种 设备 ， 控 制 设备 的 各 种 操作 ， 完 成 IO 设备 与 主 存 之 间 的 数据 交换 。 

设备 管理 的 主要 功能 是 动态 地 掌握 并 记录 设备 的 状态 、 设 备 分 配 和 释放 、 缓 冲 区 管理 、 实 
现 物 理 IO 设备 的 操作 、 提 供 设备 使 用 的 用 户 接口 及 设备 的 访问 和 控制 。 


4.4.2 1/O 软件 


设备 管理 软件 的 设计 水 平 决 定 了 设备 管理 的 效率 。 从 事 IO 设备 管理 软件 的 结构 ， 其 基本 
思想 是 分 层 构造 ， 也 就 是 说 把 设备 管理 软件 组 织 成 为 一 系列 的 层次 。 其 中 ， 低 层 与 硬件 相关 ， 
它 把 硬件 与 较 高 层次 的 软件 隔离 开 来 ， 而 最 高 层 的 软件 则 向 应 用 提供 一 个 友好 的 、 清 晰 且 统一 
的 接口 。 

设计 VO 软件 的 主要 目标 是 设备 独立 性 和 统一 命名 。LO 软件 独立 于 设备 ， 就 可 以 提高 设 
备 管理 软件 的 设计 效率 。 当 输入 /输出 设备 更 新 时 ,没有 必要 重新 编写 全 部 设备 驱动 程序 。 用 户 
在 实际 应 用 中 也 可 以 看 到 ， 在 常用 操作 系统 中 ， 只 要 安装 了 相对 应 的 设备 驱动 程序 ， 就 可 以 很 
方便 地 安装 好 新 的 输入 /输出 设备 ， 甚 至 不 必 重 新 编译 就 能 将 设备 管理 程序 移 到 他 处 执行 。 

IO 设备 管理 软件 一 般 分 为 4 层 : 中 断 处 理 程 序 、 设 备 驱动 程序 、 与 设备 无 关 的 系统 软件 
和 用 户 级 软件 。 至 于 一 些 具体 分 层 时 细节 上 的 处 理 ， 是 依赖 于 系统 的 ， 没 有 严格 的 划分 ， 只 要 
有 利于 设备 独立 这 一 目标 ， 就 可 以 为 了 提高 效率 设计 不 同 的 层次 结构 。 

IO 软件 的 所 有 层次 及 每 一 层 的 主要 功能 如 图 4-26 所 示 。 

图 中 的 箭头 给 出 了 IO 部 分 的 控制 流 。 这 里 举 一 个 读 硬盘 文件 的 例子 ， 当 用 户 程序 试图 读 
一 个 硬盘 文件 时 ， 需 要 通过 操作 系统 实现 这 一 操作 。 与 设备 无 关 软 件 检查 高 速 缓存 中 有 无 要 读 
的 数据 块 ， 若 没有 ， 则 调用 设备 驱动 程序 ， 向 IO 硬件 发 出 一 个 请 求 。 然 后 ， 用 户 进程 阻塞 并 
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等 待 磁盘 操作 的 完成 。 当 磁盘 操作 完成 时 ， 硬 件 产生 一 个 中 断 ， 转 入 中 断 处 理 程序 。 中 断 处 理 
程序 检查 中 断 的 原因 ， 认 识 到 这 时 磁盘 读 取 操作 已 经 完成 ， 于 是 唤醒 用 户 进程 取 回 从 磁盘 读 取 
的 信息 ， 从 而 结束 此 次 VO 请 求 。 用 户 进程 在 得 到 了 所 需 的 硬盘 文件 内 容 之 后 ， 继 续 运行 。 

VO 请 求 层次 VO 应答 IO 功能 


进行 VO 调用、 格式 化 JO、Spooling 
命名 、 保护 、 阻塞 、 缓 圳 、 分配 
置 设备 寄存 器 ; 检查 状态 

当 VO 结束 时 唤醒 驱动 程序 

执行 VO 操作 


图 4-26 IO 系统 的 层次 结构 与 每 层 的 主要 功能 


4.4.3 设备 管理 采用 的 相关 技术 

1， 通道 技术 

引入 通道 的 目的 是 使 数据 的 传输 独立 于 CPU， 使 CPU 从 烦琐 的 IO 工作 中 解脱 出 来 。 设 
置 通道 后 ，CPU 只 需 向 通道 发 出 IO 命令 ， 通 道 收 到 命令 后 ， 从 主 存 中 取出 本 次 IO 要 执行 的 
通道 程序 并 执行 ， 仅 当 通 道 完 成 了 IO 任务 后 才 向 CPU 发 出 中 断 信和 号。 

根据 信息 交换 方式 的 不 同 , 将 通道 分 为 字 节 多 路 通道 、 数 组 选择 通道 和 数组 多 路 通道 三 类 。 
由 于 通道 价格 昂贵 ， 导 致 计 算 机 系统 中 的 通道 数 是 有 限 的 ， 这 往往 会 成 为 输入 /输出 的 “瓶颈 ” 
问题 。 在 一 个 单 通路 的 IO 系统 中 ， 主 存 和 设备 之 间 只 有 一 条 通路 。 一 旦 某 通 道 被 设备 占用 ， 
即使 另 一 通道 空闲 ， 连 接 该 通道 的 其 他 设备 也 只 有 等 待 。 解 决 “ 瓶 颈 ” 问 题 的 最 有 效 方法 是 增 
加 设备 到 主机 之 间 的 通路 ， 使 得 主 存 和 设备 之 间 有 两 条 以 上 的 通路 。 

2. DMA 技术 


直接 主 存 存 取 (Direct Memory Access，DMA) 是 指数 据 在 主 存 与 VO 设备 间 直 接 成 块 传 
送 ， 即 在 主 存 与 IO 设备 间 传 送 一 个 数据 块 的 过 程 中 不 需要 CPU 的 任何 干涉 ， 只 需要 CPU 在 
过 程 开始 启动 〈 即 向 设备 发 出 “传送 一 块 数据 ”的 命令 ) 与 过 程 结 束 〈CPU 通过 轮 询 或 中 断 得 
知 过 程 是 否 结束 和 下 次 操作 是 否 准备 就 绪 ) 时 的 处 理 ， 实 际 操作 由 DMA 硬件 直接 执行 完成 ， 
CPU 在 此 传送 过 程 中 可 做 别 的 事情 。 例 如 ， 在 非 DMA 时 ， 打 印 2048 字 节 至 少 需要 执行 2048 
次 输出 指令 ， 加 上 2048 次 中 断 处 理 的 代价 。 而 在 DMA 情况 下 ， 若 一 次 DMA 可 传送 512 个 字 
节 ， 则 只 需要 执行 4 次 输出 指令 和 处 理 4 次 打印 机 中 断 。 若 一 次 DMA 可 传送 字 节 数 大 于 等 于 
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2048 个 字 节 ， 则 只 需要 执行 一 次 输出 指令 和 处 理 一 次 打印 机 中 断 。 
3. 缓冲 技术 


缓冲 技术 可 提高 外 设 利用 率 ， 尽 可 能 使 外 设 处 于 忙 状 态 。 缓 冲 技术 可 以 采用 硬件 缓冲 和 软 
件 缓冲 。 硬 件 缓冲 是 利用 专门 的 硬件 寄存 器 作为 缓冲 ， 软 件 缓冲 是 通过 操作 系统 来 管理 的 。 引 
入 缓冲 的 主要 原因 有 以 下 几 个 方面 。 

(1) 缓和 CPU 与 JO 设备 间 速 度 不 匹配 的 矛盾 。 

(2) 减少 对 CPU 的 中 断 频率 ， 放 宽 对 中 断 响应 时 间 的 限制 。 

(3) 提高 CPU 和 1O 设备 之 间 的 并 行 性 。 

在 所 有 的 IO 设备 与 处 理 机 〈 主 存 ) 之 间 都 使 用 了 缓冲 区 来 交换 数据 ， 所 以 操作 系统 必须 
组 织 和 管理 好 这 些 缓冲 区 。 缓 冲 可 分 为 单 缓冲 、 双 缓冲 、 多 缓冲 和 环形 缓冲 。 


4. Spooling 技术 


Spooling 是 Simultaneous Peripheral Operations On Line (外 围 设备 联机 操作 ) 的 简称 。 所谓 
Spooling 技术 ， 实 际 上 是 用 一 类 物理 设备 模拟 另 一 类 物理 设备 的 技术 ， 是 使 独占 使 用 的 设备 变 
成 多 台 虚 拟 设备 的 一 种 技术 ， 也 是 一 种 速度 匹配 技术 。 

Spooling 系统 是 由 “ 预 输入 程序 ”“ 缓 输出 程序 ”和 “ 井 管理 程序 ”以 及 输入 和 输出 井 组 
成 的 。 其 中 ， 输 入 井 和 输出 井 是 为 了 存放 从 输入 设备 输入 的 信息 以 及 作业 执行 的 结果 ， 系 统 在 
辅助 存储 器 上 开辟 的 存储 区 域 。Spooling 系统 的 组 成 和 结构 如 图 4-27 所 示 。 


作业 1 


EE 
> 
这 
或 


作业 结果 | 输出 设备 | | 和 


图 4-27 ”Spooling 系统 的 组 成 和 结构 


Spooling 系统 的 工作 过 程 是 操作 系统 初 启 后 激活 Spooling 预 输入 程序 使 它 处 于 捕获 输入 请 
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求 的 状态 ， 一 旦 有 输入 请 求 消息 ，Spooling 输入 程序 立即 得 到 执行 ， 把 装 在 输入 设备 上 的 作业 
输入 到 硬盘 的 输入 井中 并 填写 好 作业 表 ， 以 便 在 作业 执行 中 要 求 输入 信息 时 可 以 随时 找到 它们 
的 存放 位 置 。 当 作业 需要 输出 数据 时 , 可 以 先 将 数据 送 到 输出 井 , 当 输 出 设备 空闲 时 , 由 Spooling 
输出 程序 把 硬盘 上 输出 井 的 数据 送 到 慢 速 的 输出 设备 上 。 

Spooling 系统 中 拥有 一 张 作 业 表 用 来 登记 进入 系统 的 所 有 作业 的 作业 名 、 状 态 和 预 输入 表 
位 置 等 信息 。 每 个 用 户 作业 拥有 一 张 预 输入 表 来 登记 该 作业 的 各 个 文件 的 情况 ， 包 括 设备 类 、 
信息 长 度 及 存放 位 置 等 。 输 入 井中 的 作业 有 如 下 4 种 状态 。 

(1) 提交 状态 。 作 业 的 信息 正 从 输入 设备 上 预 输入 。 

(2) 后 备 状 态 。 作 业 预 输入 结束 但 未 被 选中 执行 。 

(3) 执行 状态 。 作 业已 被 选中 运行 ， 在 运行 过 程 中 ， 它 可 从 输入 井中 读 取 数 据 信 息 ， 也 可 
向 输出 井 写 信息 。 

(4) 完成 状态 。 作 业已 经 撤离 ， 该 作业 的 执行 结果 等 待 缓 输出。 

【 例 4.14】 某 计算 机 系统 输入 /输出 采用 双 缓 冲 工作 方式 ， 其 工作 过 程 如 下 图 所 示 ， 假 
设 磁盘 块 与 缓冲 区 大 小 相同 ， 每 个 盘 块 读 入 缓冲 区 的 时 间 工 为 10hs,， 缓冲 区 送 用 户 区 的 时 
间 M 为 6hs,， 系统 对 每 个 磁盘 块 数据 的 处 理 时 间 C 为 2nhs。 若 用 户 需 要 将 大 小 为 10 个 磁盘 
块 的 Docl 文件 逐 块 从 磁盘 读 入 缓冲 区 ， 并 送 用 户 区 进行 处 理 ， 那 么 采用 双 缓 冲 需要 花费 
的 时 间 为 _CL)_ hs， 比 使 用 单 缓冲 节约 了 _ (2) hs 时 间 。 


用 户 进 得 

处 理 (C) Qo 输入 CD Uoi 各 

> 9 
(1) A. 100 B. 108 C. 162 D. 180 
(2) A.0 B.8 C. 54 D. 62 


分 析 〈1): 本 小 题 的 正确 的 答案 为 B。 双 缓冲 的 工作 特点 是 可 以 实现 对 缓冲 区 中 数 
据 的 输入 T 和 提取 M， 与 CPU 的 计算 C， 三 者 并 行 工 作 。 双 缓冲 的 工作 基本 工作 过 程 
是 在 设备 输入 时 ， 先 将 数据 输入 到 缓冲 区 1， 装 满 后 便 转向 缓冲 区 2。 所 以 双 缓冲 进一步 
加 快 了 IO 的 速度 ， 提 高 了 设备 的 利用 率 。 在 双 缓冲 时 ， 系 统 处 理 一 块 数据 的 时 间 可 以 粗 
略 地 认为 是 Max(C,T)。 如 果 C<T， 可 使 块 设备 连续 输入 ; 如 果 C>T， 则 可 使 系统 不 必 
等 待 设备 输入 。 本 题 每 一 块 数据 的 处 理 时 间 为 10， 采 用 双 缓 冲 需要 花费 的 时 间 为 10X 
10+6+2=108。 

分 析 (2): 本 小 题 的 正确 的 答案 为 C。 采 用 单 缓冲 的 工作 过 程 如 图 4-28 所 示 。 
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用 户 进 程 
处 理 (C) 和 
传送 (M) 输入 (T) 
[Ef 及 上- 一 一 一 [ 肥 区 1/0 设 备 


图 4-28 单 缓冲 工作 过 程 图 


当 第 一 块 数据 送 入 用 户 工作 区 后 ， 缓 冲 区 是 空闲 的 可 以 传送 第 二 块 数据 。 这 样 第 一 块 
数据 的 处 理 C1 与 第 二 块 数据 的 输入 T2 是 可 以 并 行 的 ， 依 次 类 推 ， 如 图 4-29 所 示 。 


= 
有 
一 。。 


T Tz 
1 MI 1 ML: 


1 2 
LG EG Co 


图 4-29 单 缓冲 并 行 工作 示意 图 


系统 对 每 一 块 数 据 的 处 理 时 间 为 : Max(C.T)+M。 因为 ， 当 T>C 时 ， 处 理 时 间 为 M+T; 
当 T<C 时 ， 处 理 时 间 为 M+C。 本 题 每 一 块 数据 的 处 理 时 间 为 10+6=16，Docl 文件 的 处 理 
时 间 为 16X10+2=162hs， 比 使 用 单 缓冲 节约 了 162-108=54hs 时 间 。 


4.4.4 磁盘 调度 


磁盘 是 可 被 多 个 进程 共享 的 设备 。 当 有 多 个 进程 请 求 访问 磁盘 时 ， 为 了 保证 信息 的 安全 ， 
系统 在 每 一 时 刻 只 允许 一 个 进程 启动 磁盘 进行 VO 操作 ， 其 余 的 进程 只 能 等 待 。 因 此 ， 操 作 系 
统 应 采用 一 种 适当 的 调度 算法 ， 使 各 进程 对 磁盘 的 平均 访问 (主要 是 寻 道 ) 时 间 最 小 。 磁 盘 调 
度 分 为 移 辟 调度 和 旋转 调度 两 类 ， 并 且 是 先进 行 移 璧 调度， 然后 进行 旋转 调度 。 由 于 访问 磁盘 
最 耗 时 的 是 寻 道 时 间 ， 因 此 ， 磁 盘 调 度 的 目标 是 使 磁盘 的 平均 寻 道 时 间 最 少 。 

1. 磁盘 驱动 调度 


常用 的 磁盘 调度 算法 如 下 。 

(1) 先 来 先 服务 (First-Come First-Served，FCFS)。 这 是 最 简单 的 磁盘 调度 算法 ， 它 根据 
进程 请 求 访问 磁盘 的 先后 次 序 进行 调度 。 此 算法 的 优点 是 公平 、 简 单 ， 且 每 个 进程 的 请 求 都 能 
依次 得 到 处 理 ， 不 会 出 现 某 进程 的 请 求 长 期 得 不 到 满足 的 情况 。 但 此 算法 由 于 未 对 寻 道 进行 优 
化 ， 致 使 平均 寻 道 时 间 可 能 较 长 。 

(2) 最 短 寻 道 时 间 优 先 (Shortest Seek Time First，SSTF )。 该 算法 选择 这 样 的 进程 ， 其 要 
求 访问 的 磁道 与 当前 磁头 所 在 的 磁道 距离 最 近 ， 使 得 每 次 的 寻 道 时 间 最 短 。 但 这 种 调度 算法 不 
能 保证 平均 寻 道 时 间 最 短 。 


bl 
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(3) 扫描 算法 (SCAN)。 扫描 算法 不 仅 考 虑 到 要 访问 的 磁道 与 当前 磁道 的 距离 ， 更 优先 考 
虑 的 是 磁头 的 当前 移动 方向 。 例 如 ， 当 磁头 正在 由 里 向 外 移动 时 ，SCAN 算法 所 选择 的 下 一 个 
访问 对 象 应 是 其 要 访问 的 磁道 既 在 当前 磁道 之 外 ， 又 是 距离 最 近 的 。 这 样 由 里 向 外 地 访问 ， 直 
到 再 无 更 外 的 磁道 需要 访问 时 才 将 磁 臂 换 向 ， 由 外 向 里 移动 。 这 时 ， 同 样 也 是 每 次 选择 在 当前 
磁道 之 内 ， 且 距离 最 近 的 进程 来 调度 。 这 样 ， 磁 头 逐 步 地 向 里 移动 ， 直 到 再 无 更 里 面 的 磁道 需 
要 访问 。 显 然 ， 这 种 方式 避免 了 饥饿 现象 的 出 现 。 在 这 种 算法 中 ， 磁 头 移动 的 规律 颇 似 电梯 的 
运行 ， 故 又 常 称 为 电梯 调度 算法 。 

(4) 单 向 扫描 调度 算法 (CSCAN)。SCAN 存在 这 样 的 问题 : 当 磁头 刚 从 里 向 外 移动 过 某 
一 磁道 时 ， 恰 有 一 进程 请 求 访问 此 磁道 ， 这 时 该 进程 必须 等 待 ， 待 磁头 从 里 向 外 ， 再 从 外 向 里 
扫描 完 所 有 要 访问 的 磁道 后 才 处 理 该 进程 的 请 求 ， 致 使 该 进程 的 请 求 被 严重 地 推迟 。 为 了 减少 
这 种 延迟 ， 算 法 规定 磁头 只 做 单 向 移动 。 


2. 旋转 调度 算法 


当 移 动 辟 定 位 后 ， 有 多 个 进程 等 待 访问 该 柱 面 时 ， 应 当 如 何 决定 这 些 进程 的 访问 顺序 ? 这 
就 是 旋转 调度 要 考虑 的 问题 。 显然 , 系统 应 该 选择 延迟 时 间 最 短 的 进程 对 磁盘 的 扇 区 进行 访问 。 
当 有 若干 等 待 进程 请 求 访问 磁盘 上 的 信息 时 ， 旋 转调 度 应 考虑 如 下 情况 。 

(1) 进程 请 求 访问 的 是 同一 磁道 上 不 同 编号 的 扇 区 。 

(2) 进程 请 求 访问 的 是 不 同 磁道 上 不 同 编号 的 扇 区 。 

(3) 进程 请 求 访问 的 是 不 同 磁道 上 具有 相同 编号 的 扇 区 。 

对 于 (1) 和 (2)， 旋 转调 度 总 是 让 首先 到 达 读 / 写 磁头 位 置 下 的 扇 区 先进 行 传送 操作 ， 对 
于 (3)， 旋 转调 度 可 以 任 选 一 个 读 / 写 磁头 位 置 下 的 扇 区 进行 传送 操作 。 

【 例 4.15】 数据 存储 在 磁盘 上 的 排列 方式 会 影响 IO 服务 的 总 时 间 。 假 设 每 个 磁道 划分 成 
10 个 物理 块 ， 每 块 存放 1 个 逻辑 记录 。 逻 辑 记 录 RI，R,，…，Rio 存 放 在 同一 个 磁道 上 ， 记 录 
的 安排 顺序 如 下 表 所 示 。 


假定 磁盘 的 旋转 速度 为 每 周 20ms， 磁 头 当 前 处 在 Ri 的 开始 处 。 若 系统 顺序 处 理 这 
些 记 录 ， 使 用 单 缓冲 区 ， 每 个 记录 处 理 时 间 为 4ms， 则 处 理 这 10 个 记录 的 最 长 时 间 
为 _QD _; 对 信息 存储 进行 优化 分 布 后 ， 处 理 10 个 记录 的 最 少时 间 为 2) 。 

(1) A. 180ms B. 200ms C. 204ms D. 220ms 

(2) A. 40ms B. 60ms C. 100ms D. 160ms 
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室 (1) 分 析 : 系统 读 记 录 的 时 间 为 20/110 二 2ms， 对 于 第 一 种 情况 ， 系 统 读 出 并 处 理 记录 
RR 之 后 ， 磁 头 已 转 到 记录 玉 的 开始 处 ， 所 以 为 了 读 出 记录 R,， 磁 盘 必 须 再 转 一 圈 ， 需 要 2ms 
( 读 记 录 ) 加 20ms 转 一 圈 ) 的 时 间 。 这 样 ， 处 理 10 个 记录 的 总 时 间 应 为 处 理 前 9 个 记录 〔 即 
Ri、Rs、*…、Ro) 的 总 时 间 再 加 上 读 Rie 和 处 理 时 间 ， 即 9X22ms+ 6ms=204ms。 

空 (2) 分 析 : 对 于 第 二 种 情况 ， 若 对 信息 进行 分 布 优化 的 结果 如 下 表 所 示 。 


物理 块 1 2 3 4 5 6 7 8 9 10 
逻辑 记录 RI Rs Rs R2 Ro Re Rs Rio Ry R4 
可 以 看 出 ， 当 读 出 记录 玉 并 处 理 结 束 后 ， 磁 头 刚好 转 至 R, 记录 的 开始 处 ， 立 即 就 可 以 读 
出 并 处 理 ， 因 此 处 理 10 个 记录 的 总 时 间 为 0X (2ms〔 读 记录 ) +4ms〔 处 理 记录 ) ) 三 10X 
6ms=60ms。 


【 例 4.16】 当 进 程 请 求 读 磁 盘 时 ， 操 作 系 统 _Q) _。 假 设 磁 盘 的 每 个 磁道 有 10 个 扇 区 ， 
移动 臂 位 于 18 号 柱 面 上 ， 且 进程 的 请 求 序列 如 表 4-3 所 示 。 


表 4-3 进程 的 请 求 序列 


请 求 序列 柱 面 号 磁 头 号 扇 区 号 
© 15 8 9 
@ 20 6 3 
® 20 9 6 
@ 40 10 5 
© 15 8 4 
© 6 3 10 
©@ 8 7 9 
®@ 15 10 4 
那么 ， 按 照 最 短 寻 道 时 间 优 先 的 响应 序列 为 _ (2)〉_。 
(1) A. 只 需要 进行 旋转 调度 ， 无 须 进行 移 臂 调 度 
B. 旋转 、 移 臂 调 度 同 时 进行 
C. 先进 行 移 臂 调 度 ， 再 进行 旋转 调度 
D. 先进 行 旋转 调度 ， 再 进行 移 臂 调度 
(2) A. QODOO B. GADVDOO 
C. OVDDOOOY D. OOBOBOGBG@ 


分 析 : 空 (1) 的 正确 答案 为 C; 空 (2) 的 正确 答案 为 A。 
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当 进 程 请 求 读 磁盘 时 ， 操 作 系 统 先进 行 移 臂 调度， 再 进行 旋转 调度 。 由 于 移动 辟 位 于 18 
号 柱 面 上 , 按照 最 短 寻 道 时 间 优先 的 响应 柱 面 序列 为 20 一 15 一 8 一 6 一 40。 按照 旋转 调度 的 原则 
进程 在 20 号 柱 面 上 的 响应 序列 为 @ 一 @， 因 为 进程 访问 的 是 不 同 磁道 上 的 不 同 编号 的 扇 区 ， 旋 
转调 度 总 是 让 首先 到 达 读 / 写 磁 头 位 置 下 的 扇 区 先进 行 传送 操作 。 进 程 在 15 号 柱 面 上 的 响应 序 
列 为 加 一 四 一 图 或 @ 一 中 一 回 。 对 于 @ 和 @@ 可 以 任 选 一 个 进行 读 / 写 ， 因 为 进程 访问 的 是 不 同 磁 
道上 具有 相同 编号 的 扇 区 ， 旋 转调 度 可 以 任 选 一 个 读 / 写 磁头 位 置 下 的 扇 区 进行 传送 操作 。@ 在 
40 号 柱 面 上 。@ 在 6 号 柱 面 上 。@ 在 8 号 柱 面 上 。 


4.5 文件 管理 


如 果 没 有 文件 系统 用 户 要 访问 外 存储 器 上 的 信息 是 很 麻烦 的 ， 不 仅 要 考虑 信息 在 外 存储 器 
上 的 存放 位 置 ， 而 且 要 记 住 信息 在 外 存储 器 的 分 布 情况 ， 构 造 IO 程序 。 稍 不 注意 ， 就 会 破坏 
已 存放 的 信息 。 特 别 是 多 道 程序 技术 出 现 后 ， 多 个 用 户 之 间 根 本 无 法 预料 各 个 不 同 程序 间 的 信 
息 在 外 存储 器 上 是 如 何 分 配 的 。 鉴 于 这 些 原因 , 引入 文件 系统 专门 负责 管理 外 存储 器 上 的 信息 ， 
而 这 些 信息 是 以 文件 的 形式 存放 的 ， 使 用 户 可 以 “ 按 名 ”高 效 、 快 速 和 方便 地 存 取信 息 。 


4.5.1 文件 与 文件 系统 
1. 文件 


文件 (File) 是 具有 符号 名 的 、 在 逻辑 上 具有 完整 意义 的 一 组 相关 信息 项 的 集合 。 例 如 ， 
一 个 源 程序 、 一 个 目标 程序 、 编 译 程序 、 一 批 待 加 工 的 数据 和 各 种 文档 等 都 可 以 各 自 组 成 一 个 
文件 。 

信息 项 是 构成 文件 内 容 的 基本 单位 , 可 以 是 一 个 字符 , 也 可 以 是 一 个 记录 , 记录 可 以 等 长 ， 
也 可 以 不 等 长 。 一 个 文件 包括 文件 体 和 文件 说 明 。 文 件 体 是 文件 真实 的 内 容 。 文 件 说 明 是 操作 
系统 为 了 管理 文件 所 用 到 的 信息 ， 包 括 文件 名 、 文 件 内 部 标识 、 文 件 的 类 型 、 文 件 存储 地 址 、 
文件 的 长 度 、 访 问 权限 、 建 立时 间 和 访问 时 间 等 。 

文件 是 一 种 抽象 机 制 ， 它 隐藏 了 硬件 和 实现 细节 ， 提 供 了 将 信息 保存 在 磁盘 上 而 且 使 于 以 
后 读 取 的 手段 ， 使 用 户 不 必 了 解 信息 存储 的 方法 、 位 置 以 及 存储 设备 实际 操作 方式 便 可 存 取信 
息 。 因 此 ， 文 件 管理 中 的 一 个 非常 关键 的 问题 在 于 文件 的 命名 。 文 件 名 是 在 进程 创建 文件 时 确 
定 的 ， 以 后 这 个 文件 将 独立 于 进程 存在 直到 它 被 显 式 删除 。 当 其 他 进程 要 使 用 文件 时 必须 显 式 
指出 该 文件 名 ， 操 作 系 统 根据 文件 名 对 其 进行 控制 和 管理 。 不 同 的 操作 系统 ， 文 件 的 命名 规则 
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有 所 不 同 ， 即 文件 名 字 的 格式 和 长 度 因 系统 而 异 。 
2. 文件 系统 


由 于 计算 机 系统 处 理 的 信息 量 越 来 越 大 ， 所 以 不 可 能 将 所 有 的 信息 保存 到 主 存 中 。 特 别 是 
在 多 用 户 系 统 中 ， 既 要 保证 各 用 户 文件 存放 的 位 置 不 冲突 ， 又 要 防止 任 一 用 户 对 外 存储 器 〈 简 
称 外 存 ) 空间 占 而 不 用 ; 既 要 保证 各 用 户 文件 在 未 经 许可 的 情况 下 不 被 窃取 和 破坏 ， 又 要 允许 
在 特定 的 条 件 下 多 个 用 户 共享 某 些 文件 。 因 此 ， 需 要 设立 一 个 公共 的 信息 管理 机 制 来 负责 统一 
管理 外 存 和 外 存 上 的 文件 。 

所 谓 文件 管理 系统 ， 就 是 操作 系统 中 实现 文件 统一 管理 的 一 组 软件 和 相关 数据 的 集合 ， 专 
门 负责 管理 和 存 取 文 件 信息 的 软件 机 构 ， 简 称 文件 系统 。 文 件 系统 的 功能 包括 按 名 存 取 ， 即 用 
户 可 以 “ 按 名 存 取 ” 而 不 是 “ 按 地 址 存 取 ”; 统一 的 用 户 接口 ， 在 不 同 设备 上 提供 同样 的 接口 ， 
方便 用 户 操作 和 编程 ， 并 发 访问 和 控制 ， 在 多 道 程序 系统 中 支持 对 文件 的 并 发 访问 和 控制 ， 安 
全 性 控制 ， 在 多 用 户 系统 中 的 不 同 用 户 对 同一 文件 可 有 不 同 的 访问 权限 ， 优 化 性 能 ， 采 用 相关 
技术 提高 系统 对 文件 的 存储 效率 、 检 索 和 读 / 写 性 能 ， 差错 恢 复 ， 能 够 验证 文件 的 正确 性 ， 并 有 具 
有 一 定 的 差错 恢复 能 力 。 

3. 文件 的 类 型 


(1) 按 文件 性 质 和 用 途 可 将 文件 分 为 系统 文件 、 库 文件 和 用 户 文件 。 

(2) 按 信息 保存 期 限 分 类 可 将 文件 分 为 临时 文件 、 档 案 文件 和 永久 文件 。 

(3) 按 文 件 的 保护 方式 分 类 可 将 文件 分 为 只 读 文 件 、 读 / 写 文件 、 可 执行 文件 和 不 保护 文件 。 

(4) UNIX 系统 将 文件 分 为 普通 文件 、 目 录 文 件 和 设备 文件 〈 特 殊 文件 )。 

目前 常用 的 文件 系统 类 型 有 FAT、Vfat、NTFS、Ext2 和 HPFS 等 。 

文件 分 类 的 目的 是 对 不 同文 件 进行 管理 ， 提 高 系统 效率 ， 提 高 用 户 界面 友好 性 。 当 然 ， 根 
据 文件 的 存 取 方 法 和 物理 结构 的 不 同 还 可 以 将 文件 分 为 不 同 的 类 型 ， 这 将 在 文件 的 逻辑 结构 和 
文件 的 物理 结构 中 介绍 。 


4.5.2 文件 的 结构 和 组 织 


文件 的 结构 是 指 文件 的 组 织 形式 。 从 用 户 角度 看 到 的 文件 组 织 形式 称 为 文件 的 逻辑 结 
构 ， 文 件 系 统 的 用 户 只 要 知道 所 需 文件 的 文件 名 就 可 以 存 取 文件 中 的 信息 ， 而 无 须知 道 这 些 
文件 究竟 存放 在 什么 地 方 。 从 实现 的 角度 看 ， 文 件 在 文件 存储 器 上 的 存放 方式 称 为 文件 的 物理 
结构 。 
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1. 文件 的 逻辑 结构 


文件 的 逻辑 结构 可 分 为 两 大 类 : 一 是 有 结构 的 记录 式 文件 ， 它 是 由 一 个 以 上 的 记录 构成 的 
文件 ， 故 又 称 为 记录 式 文件 ， 二 是 无 结构 的 流 式 文件 ， 它 是 由 一 串 顺序 字符 流 构成 的 文件 。 

1) 有 结构 的 记录 式 文 件 

在 记录 式 文件 中 , 所 有 的 记录 通常 都 是 描述 一 个 实体 集 的 , 有 着 相同 或 不 同 数 目的 数据 项 ， 
记录 的 长 度 可 分 为 定 长 和 不 定 长 两 类 。 

(1) 定 长 记录 。 指 文件 中 所 有 记录 的 长 度 相 同 。 所 有 记录 中 的 各 个 数据 项 都 处 在 记录 中 相 
同 的 位 置 ， 具 有 相同 的 顺序 及 相同 的 长 度 ， 文 件 的 长 度 用 记录 数目 表示 。 定 长 记录 的 特点 是 处 
理 方便 ， 开 销 小 ， 它 是 目前 较 常 用 的 一 种 记录 格式 ， 被 广泛 用 于 数据 处 理 中 。 

(2) 变 长 记录 。 指 文件 中 各 记录 的 长 度 不 相同 。 这 是 因为 :一 个 记录 中 所 包含 的 数据 项 数 
目 可 能 不 同 ， 如 书 的 著作 者 、 论 文中 的 关键 词 ， 数 据 项 本 身 的 长 度 不 定 ， 如 病历 记录 中 的 病 
因 、 病 史 ， 科 技 情报 记录 中 的 摘要 等 。 但 是 ， 不 论 是 哪 一 种 结构 ， 在 处 理 前 每 个 记录 的 长 度 是 可 
知 的 。 

2) 无 结构 的 流 式 文件 

文件 体 为 字 节 流 ， 不 划分 记录 。 无 结构 的 流 式 文件 通常 采用 顺序 访问 方式 ， 并 且 每 次 读 / 
写 访问 可 以 指定 任意 数据 长 度 ， 其 长 度 以 字 节 为 单位 。 对 于 流 式 文件 访问 ， 是 利用 读 / 写 指针 指 
出 下 一 个 要 访问 的 字符 。 可 以 把 流 式 文 件 看 作 是 记录 式 文件 的 一 个 特例 。 在 UNIX 系统 中 ， 所 
有 的 文件 都 被 看 作 是 流 式 文件 ， 即 使 是 有 结构 的 文件 ， 也 被 视 为 流 式 文件 ， 系 统 不 对 文件 进行 
格式 处 理 。 


2. 文件 的 物理 结构 


文件 的 物理 结构 是 指 文件 的 内 部 组 织 形式 ， 即 文件 在 物理 存储 设备 上 的 存放 方法 。 由 于 文 
件 的 物理 结构 决定 了 文件 在 存储 设备 上 的 存放 位 置 ， 所 以 文件 的 逻辑 块 号 到 物理 块 号 的 转换 也 
是 由 文件 的 物理 结构 决定 的 。 根 据 用 户 和 系统 管理 上 的 需要 ， 可 采用 多 种 方法 来 组 织 文件 ， 下 
面 介绍 几 种 常见 的 文件 物理 结构 。 

(1) 连续 结构 。 连 续 结构 也 称 顺序 结构 ， 它 将 逻辑 上 连续 的 文件 信息 (如 记录 ) 依次 存放 
在 连续 编号 的 物理 块 上 。 只 要 知道 文件 的 起 始 物理 块 号 和 文件 的 长 度 ， 就 可 以 很 方便 地 进行 文 
件 的 存 取 。 

对 文件 诸 记 录 进 行 批量 存 取 时 ， 连 续 结构 在 所 有 逻辑 文件 中 的 存 取 效 率 是 最 高 的 。 但 在 交 
互 应 用 的 场合 ， 如 果 用 户 〈 程 序 ) 要 求 随机 地 查找 或 修改 单个 记录 ， 此 时 系统 需要 逐个 地 查找 
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各 个 记录 ， 这 样 采用 连续 结构 所 表现 出 来 的 性 能 就 可 能 很 差 ， 尤 其 是 当 文件 较 大 时 情况 更 为 严 
重 。 连 续 结 构 的 另 一 个 缺点 是 不 便于 记录 的 增加 或 删除 操作 。 为 了 解决 这 个 问题 ， 可 以 为 采用 
连续 结构 的 文件 配置 一 个 运行 记录 文件 (Log File) 或 称 为 事务 文件 (Transactor File)， 规 定 每 
隔 一 定时 间 ， 例 如 4 小 时 ,将 运行 记录 文件 与 原来 的 主 文件 进行 合并 , 产生 一 个 新 文件 。 这 样 ， 
不 必 每 次 对 记录 进行 增加 或 删除 操作 ， 物 理 移 动 磁盘 信息 ， 使 其 成 为 连续 结构 。 

(2) 链接 结构 。 链 接 结构 也 称 串 联结 构 ， 它 是 将 逻辑 上 连续 的 文件 信息 (如 记录 ) 存放 在 
不 连续 的 物理 块 上 ， 每 个 物理 块 设 有 一 个 指针 指向 下 一 个 物理 块 。 因此， 只 要 知道 文件 的 第 一 
个 物理 块 号 ， 就 可 以 按 链 指针 查找 整个 文件 。 

(3) 索引 结构 。 在 采用 索引 结构 时 ， 将 逻辑 上 连续 的 文件 信息 (如 记录 ) 存放 在 不 连续 的 
物理 块 中 ， 系 统 为 每 个 文件 建立 一 张 索引 表 。 索 引 表 记录 了 文件 信息 所 在 的 逻辑 块 号 对 应 的 物 
理 块 号 ， 并 将 索引 表 的 起 始 地 址 放 在 与 文件 对 应 的 文件 目录 项 中 。 

(4) 多 个 物理 块 的 索引 表 。 索 引 表 是 在 文件 创建 时 由 系统 自动 建立 的 ， 并 与 文件 一 起 存放 
在 同一 文件 卷 上 。 根 据 一 个 文件 大 小 的 不 同 ， 其 索引 表 占 用 物理 块 的 个 数 不 等 ， 一 般 占 一 个 或 
几 个 物理 块 。 多 个 物理 块 的 索引 表 可 以 有 两 种 组 织 方式 : 链接 文件 和 多 重 索引 方式 。 

在 UNIX 文件 系统 中 采用 的 是 三 级 索引 结构 ， 在 文件 系统 中 inode 是 基本 的 构件 ， 它 表示 
文件 系统 树 型 结构 的 结 点 。UNIX 文件 索引 表 项 分 4 种 寻 址 方式 : 直接 寻 址 、 一 级 间接 寻 址 、 
二 级 间接 寻 址 和 三 级 间接 寻 址 。 


4.5.3 文件 目录 


为 了 实现 “ 按 名 存 取 ” 系统 必须 为 每 个 文件 设置 用 于 描述 和 控制 文件 的 数据 结构 ， 它 至 
少 要 包括 文件 名 和 存放 文件 的 物理 地 址 ， 这 个 数据 结构 称 为 文件 控制 块 (FCB), 文件 控制 块 的 
有 序 集合 称 为 文件 目录 。 换 句 话 说， 文件 目录 是 由 文件 控制 块 组 成 的 ， 专 门 用 于 文件 的 检索 。 
文件 控制 块 也 称 为 文件 的 说 明 或 文件 目录 项 《简称 目录 项 )。 


1. 文件 控制 块 


文件 控制 块 中 包含 以 下 三 类 信息 : 基本 信息 类 、 存 取 控 制 信息 类 和 使 用 信息 类 。 

(1) 基本 信息 类 。 例 如 文件 名 、 文 件 的 物理 地 址 、 文 件 长 度 和 文件 块 数 等 。 

(2) 存 取 控制 信息 类 。 文 件 的 存 取 权限 ， 像 UNIX 用 户 分 成 文件 主 、 同 组 用 户 和 一 般 用 户 
三 类 ， 这 三 类 用 户 的 读 / 写 执行 RWX 权限 。 

(3) 使 用 信息 类 。 文 件 建立 日 期 、 最 后 一 次 修改 日 期 、 最 后 一 次 访问 的 日 期 、 当 前 使 用 的 
信息 《如 打开 文件 的 进程 数 、 在 文件 上 的 等 待 队列 ) 等 。 
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2. 目录 结构 


文件 目录 结构 的 组 织 方式 直接 影响 到 文件 的 存 取 速 度 ， 关 系 到 文件 的 共享 性 和 安全 性 ， 因 
此 组 织 好 文件 的 目录 是 设计 文件 系统 的 重要 环节 。 常 见 的 目录 结构 有 3 种 : 一 级 目录 结构 、 二 
级 目录 结构 和 多 级 目录 结构 。 

(1) 一 级 目录 结构 。 一 级 目录 的 整个 目录 组 织 是 一 个 线性 结构 ， 在 整个 系统 中 只 需 建立 一 
张 目 录 表 ， 系 统 为 每 个 文件 分 配 一 个 目录 项 。 一 级 目录 结构 简单 ， 缺 点 是 查找 速度 慢 ， 不 允许 
重 名 和 不 使 于 实现 文件 共享 等 ， 因 此 它 主要 用 在 单 用 户 环境 中 。 

(2) 二 级 目录 结构 。 为 了 克服 一 级 目录 结构 存在 的 缺点 引入 了 二 级 目录 结构 ， 二 级 目录 结 
构 是 由 主 文件 目录 (Master File Directory，MFD) 和 用 户 目录 (User File Directory,，UFD) 组 
成 的 。 在 主 文件 目录 中 ， 每 个 用 户 文件 目录 都 占有 一 个 目录 项 ， 其 目录 项 中 包括 用 户 名 和 指向 
该 用 户 目录 文件 的 指针 。 用 户 目录 是 由 用 户 所 有 文件 的 目录 项 组 成 的 。 

二 级 目录 结构 基本 上 克服 了 单 级 目录 的 缺点 ， 其 优点 是 提高 了 检索 目录 的 速度 ， 较 好 地 解 
决 了 重 名 问题 。 采 用 二 级 目录 结构 也 存在 一 些 问题 。 该 结构 虽然 能 有 效 地 将 多 个 用 户 隔 离开 (这 
种 隔离 在 各 个 用 户 之 间 完 全 无 关 时 是 一 个 优点 )， 但 当 多 个 用 户 之 间 要 相互 合作 去 共同 完成 一 
个 大 任务 ， 且 一 个 用 户 又 需要 去 访问 其 他 用 户 的 文件 时 ， 这 种 隔离 便 成 为 一 个 缺点 ， 因 为 这 种 
隔离 使 诸 用户 之 间 不 便于 共享 文件 。 

(3) 多 级 目录 结构 。 为 了 解决 以 上 问题 ， 在 多 道 程序 设计 系统 中 常 采用 多 级 目录 结构 ， 这 
种 目录 结构 像 一 棵 倒置 的 有 根 树 ， 所 以 也 称 为 树 型 目录 结构 。 从 树 根 向 下 ， 每 一 个 结 点 是 一 个 
目录 ， 叶 结 点 是 文件 。MS-DOS 和 UNIX 等 操作 系统 均 采 用 多 级 目录 结构 。 

在 采用 多 级 目录 结构 的 文件 系统 中 ， 用 户 要 访问 一 个 文件 ， 必 须 指出 文件 所 在 的 路 径 名 ， 
路 径 名 是 从 根 目录 开始 到 该 文件 的 通路 上 所 有 各 级 目录 名 拼 起 来 得 到 的 。 在 各 目录 名 之 间 、 目 
录 名 与 文件 名 之 间 需 要 用 分 隔 符 隔 开 。 例 如 ， 在 MS-DOS 中 分 隔 符 为 “\”， 在 UNIX 中 分 隔 符 
为 “/”。 绝 对 路 径 名 〈Absolute Path Name) 是 指 从 根 目 录 “/” 开 始 的 完整 文件 名 ， 即 它 是 由 从 
根 目 录 开 始 的 所 有 目录 名 以 及 文件 名 构成 的 。 

【 例 4.17】 若 某 文件 系统 的 目录 结构 如 下 图 所 示 ， 假 设 用 户 要 访问 文件 身 .java， 且 当前 
工作 目录 为 Program， 则 该 文件 的 全 文件 名 为 _(Q》_， 其 相对 路 径 为 _(2) 

(1) A. fl.java B. \Document\Java-prog\fl.java 


C. D:\Program\Java-prog\fl .java D. \Program\Java-prog\fl .Java 
(2) A. Java-prog\ B. \Java-prog\ 
C. Program\Java-prog D. \Program\Java-prog\ 
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C-prog [avarprog | Wang | 


com2.dll 


fl.c fc fljava f2.java 


Imyl.doc my2.doc 


分 析 : 空 (1) 正确 的 选项 为 C。 因 为 ， 文 件 的 全 文件 名 应 包括 盘 符 及 从 根 目录 开始 的 
路 径 名 ,所 以 从 题 图 可 以 看 出 文件 和 java 的 全 文件 名 为 D:\Program\Java-prog\f1 .java。 空 (2) 
正确 的 选项 为 A。 因 为 ， 文 件 的 相对 路 径 是 从 当前 工作 目录 下 的 路 径 名 ， 所 以 从 题 图 可 以 
看 出 文件 fl.java 的 相对 路 径 名 为 Java-prog\。 
4.5.4 ” 存 取 方法 和 存储 空间 的 管理 

1. 文件 的 存 取 方 法 


文件 的 存 取 方 法 是 指 读 / 写 文件 存储 器 上 的 一 个 物理 块 的 方法 ,通常 有 顺序 存 取 和 随机 存 取 
两 种 方法 。 顺序 存 取 方 法 是 指 对 文件 中 的 信息 按 顺 序 依次 进行 读 / 写 ; 随机 存 取 方法 是 指 对 文件 
中 的 信息 可 以 按 任意 的 次 序 随机 地 读 / 写 。 

2. 文件 存储 空间 的 管理 


要 将 文件 保存 到 外 部 存储 器 (简称 外 存 或 辅 存 ) 上 首先 必须 知道 存储 空间 的 使 用 情况 ， 即 哪 
些 物理 块 是 被 “占用 ”， 哪 些 是 “空闲 ”。 特 别 是 对 大 容量 的 磁盘 存储 空间 被 多 用 户 共享 时 ， 用 户 
执行 程序 经 常 要 在 磁盘 上 存储 文件 和 删除 文件 ， 因 此 ,文件 系统 必须 对 磁盘 空间 进行 管理 。 外 存 
空闲 空间 管理 的 数据 结构 通常 称 为 磁盘 分 配 表 (Disk Allocation Table)。 常 用 的 空闲 空间 的 管理 方 
法 有 空闲 区 表 、 位 示 图 、 空 闲 块 甸 和 成 组 链接 法 4 种 。 

(1) 空闲 区 表 。 将 外 存 空间 上 的 一 个 连续 的 未 分 配 区 域 称 为 “空闲 区 ”。 操 作 系统 为 磁盘 
外 存 上 的 所 有 空闲 区 建立 一 张 空闲 表 ， 每 个 表 项 对 应 一 个 空闲 区 ， 空 闲 表 中 包含 序号 、 空 闲 区 
的 第 一 块 号 、 空 闲 块 的 块 数 和 状态 等 信息 ， 如 表 4-4 所 示 。 它 适用 于 连续 文件 结构 。 


加 2?" 医 


图 230 大 。 软件 设计 师 教程 (第 5 版 ) 


表 4-4 空闲 区 表 


(2) 位 示 图 。 这 种 方法 是 在 外 存 上 建立 一 张 位 示 图 (Bitmap )， 记 录 文 件 存储 器 的 使 用 情 
况 。 每 一 位 对 应 文件 存储 器 上 的 一 个 物理 块 ， 取 值 0 和 1 分 别 表示 空闲 和 占用 。 例 如 ， 某 文件 
存储 器 上 位 示 图 的 大 小 为 n， 物 理 块 依次 编号 为 0，1，2，…。 假 如 计算 机 系统 中 字 长 为 32 位 ， 
那么 在 位 示 图 中 的 第 0 个 字 〈 录 辑 编号 ) 对 应 文件 存储 器 上 的 0，1，2，…，31 号 物理 块 ， 第 
1 个 字 对 应 文件 存储 器 上 的 32，33，34，…，63 号 物理 块 ， 依 此 类 推 ， 如 图 4-30 所 示 。 


第 3 学 加 本国 加 加 可 醒 加 加 
第 1 字 加 回国 加 加 回国 加 加 


图 4-30 位 示 图 例 


这 种 方法 的 主要 特点 是 位 示 图 的 大 小 由 磁盘 空间 的 大 小 (物理 块 总 数 ) 决定 ， 位 示 图 的 描 
述 能 力 强 ， 适 合 各 种 物理 结构 。 

(3) 空闲 块 链 。 每 个 空闲 物理 块 中 有 指向 下 一 个 空闲 物理 块 的 指针 ， 所 有 空闲 物理 块 构成 
一 个 链表 ， 链 表 的 头 指 针 放 在 文件 存储 器 的 特定 位 置 上 如 管理 块 中 )， 不 需要 磁盘 分 配 表 ， 
节省 空间 。 每 次 申请 空闲 物理 块 只 需 根据 链表 的 头 指 针 取出 第 一 个 空闲 物理 块 ， 根 据 第 一 个 空 
闲 物理 块 的 指针 可 找到 第 二 个 空闲 物理 块 ， 依 此 类 推 。 

(4) 成 组 链接 法 。UNIX 系统 采用 该 方法 。 例 如 ， 在 实现 时 系统 将 空闲 块 分 成 若干 组 ， 每 
100 个 空闲 块 为 一 组 ， 每 组 的 第 一 个 空闲 块 登记 了 下 一 组 空闲 块 的 物理 盘 块 号 和 空闲 块 总 数 。 
假如 某 个 组 的 第 一 个 空闲 块 号 等 于 0， 意 味 着 该 组 是 最 后 一 组 ， 无 下 一 组 空闲 块 。 

【 例 4.18】 某 文件 管理 系统 在 磁盘 上 建立 了 位 示 图 ， 记 录 磁 盘 的 使 用 情况 。 若 系统 的 字 
长 为 32 位 ,磁盘 上 的 物理 块 依次 编号 为 : 0、1、2、…， 那 么 4096 号 物理 块 的 使 用 情况 在 
位 示 图 中 的 第 _Q) 个 字 中 描述 ， 若 磁盘 的 容量 为 200GB， 物 理 块 的 大 小 为 MB， 那 么 
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位 示 图 的 大 小 为 _(2)〉 个 字 。 

(1) A. 129 B. 257 C.513 D. 1025 

(2) A. 600 B. 1200 C. 3200 D. 6400 

分 析 : 空 (1) 的 正确 答案 是 A。 根 据 题 意 :系统 的 字 长 为 32 位 ， 可 记录 32 个 物理 
块 的 使 用 情况 ， 这 样 0 一 31 号 物理 块 的 使 用 情况 在 位 示 图 中 的 第 1 个 字 中 描述 ，32 一 63 号 
物理 块 的 使 用 情况 在 位 示 图 中 的 第 2 个 字 中 描述 ，.……， 4064 一 4095 号 物理 块 的 使 用 情况 
在 位 示 图 中 的 第 128 个 字 中 描述 , 4096 一 4127 号 物理 块 的 使 用 情况 在 位 示 图 中 的 第 129 个 
字 中 描述 。 空 (2) 的 正确 答案 是 D。 由 于 磁盘 的 容量 为 200GB， 物 理 块 的 大 小 为 1MB， 
而 磁盘 有 200X 1024=204800 个 物理 块 ， 故 位 示 图 的 大 小 为 204800/32=6400 个 字 。 


4.5.5 文件 的 使 用 


文件 系统 将 用 户 的 逻辑 文件 按 一 定 的 组 织 方式 转换 成 物理 文件 存放 到 文件 存储 器 上 , 也 就 
是 说 , 文件 系统 为 每 个 文件 与 该 文件 在 磁盘 上 的 存放 位 置 建立 了 对 应 关系 。 当 用 户 使 用 文件 时 ， 
文件 系统 通过 用 户 给 出 的 文件 名 查 出 对 应 文件 的 存放 位 置 , 读 出 文件 的 内 容 。 在 多 用 户 环境 下 ， 
为 了 文件 安全 和 保护 起 见 ， 操 作 系 统 为 每 个 文件 建立 和 维护 关于 文件 主 、 访 问 权 限 等 方面 的 信 
息 。 为 此 ,操作 系统 在 操作 级 命令 级 ) 和 编程 级 (系统 调用 和 函数 ) 向 用 户 提供 文件 的 服务 。 

操作 系统 在 操作 级 向 用 户 提供 的 命令 有 目录 管理 类 命令 、 文 件 操作 类 命令 (如 复制 、 删 除 
和 修改 ) 和 文件 管理 类 命令 〈 如 设置 文件 权限 ) 等 。 


4.5.6 文件 的 共享 和 保护 
1. 文件 的 共享 


文件 共享 是 指 不 同 用 户 进程 使 用 同一 文件 ， 它 不 仅 是 不 同 用 户 完成 同一 任务 所 必需 的 功 
能 ， 还 可 以 节省 大 量 的 主 存 空间 ， 减 少 由 于 文件 复制 而 增加 的 访问 外 存 的 次 数 。 文 件 共 享有 多 
种 形式 ， 采 用 文件 名 和 文件 说 明 分 离 的 目录 结构 有 利于 实现 文件 共享 。 

常见 的 文件 链接 有 硬 链 接 和 符号 链接 两 种 。 

1) 硬 链接 

文件 的 硬 链 接 是 指 两 个 文件 目录 表 目 指向 同一 个 索引 结 点 的 链接 ， 该 链接 也 称 基 于 索引 结 
点 的 链接 。 换 句 话 说 ， 硬 链接 是 指 不 同文 件 名 与 同一 个 文件 实体 的 链接 。 文 件 硬 链接 不 利于 文 
件 主 删除 它 拥有 的 文件 ， 因 为 文件 主要 删除 它 拥 有 的 共享 文件 ， 必 须 首先 删除 (关闭 ) 所 有 的 
硬 链 接 ， 否 则 就 会 造成 共享 该 文件 的 用 户 的 目录 表 目 指针 悬空 。 

例如 ，UNIX 系统 中 的 im 命令 ， 可 以 将 多 个 文件 名 与 一 个 文件 体 建立 链接 ， 其 格式 为 : 

in 文件 名 新 文件 名 或 让 文件 名 目录 名 
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ls 命令 放 在 /bin 子 目 录 下 ， 可 在 /usrbin 子 目录 下 设置 一 个 DOS 兼容 的 命令 dir， 执 行 该 合 
令 相当 于 执行 命令 。 使 用 命令 可 以 给 一 个 已 存在 文件 增加 一 个 新 文件 名 , 即 文件 链接 数 增 
加 1， 此 种 链接 是 不 能 跨越 文件 系统 的 。 为 了 共享 文件 ， 只 是 在 两 个 不 同 子 目录 下 取 了 不 同 的 
文件 名 ls 和 dir, 但 它们 具有 相同 的 索引 结 点 。UNIX 这 种 文件 的 结构 称 为 树 形 带 勾 链 的 目录 结 
构 。 在 文件 的 索引 结 点 中 ，di_nlink 变量 表示 链接 到 该 索引 结 点 上 的 链接 数 ， 在 用 命令 1s -1 长 
列表 显示 时 ， 文 件 的 第 2 项 数据 项 表示 链接 数 。 

2) 符号 链接 

符号 链接 建立 新 的 文件 或 目录 ， 并 与 原来 文件 或 目录 的 路 径 名 进行 映射 ， 当 访问 一 个 符号 
链接 时 ， 系 统 通过 该 映射 找到 原文 件 的 路 径 ， 并 对 其 进行 访问 。 

例如 ，UNIX 系统 中 的 In -s 命令 建立 符号 链接 。 此 时 ， 系 统 为 共享 的 用 户 创建 一 个 link 类 
型 的 新 文件 , 将 这 新 文件 登录 在 该 用 户 共 享 目录 项 中 , 这 个 link 型 文件 包含 链接 文件 的 路 径 名 。 
该 类 文件 在 用 ls 命令 长 列表 显示 时 ， 文 件 链接 数 为 1。 

采用 符号 链接 可 以 跨越 文件 系统 ， 甚 至 可 以 通过 计算 机 网 络 连接 到 世界 上 任何 地 方 的 机 器 
中 的 文件 ， 此 时 只 需 提供 该 文件 所 在 的 地 址 以 及 在 该 机 器 中 的 文件 路 径 。 

符号 链接 的 缺点 是 其 他 用 户 读 取 符 号 链接 的 共享 文件 比 读 取 硬 链接 的 共享 文件 需要 增加 
读 盘 操作 的 次 数 。 因 为 其 他 用 户 去 读 符号 链接 的 共享 文件 时 ， 系 统 中 根据 给 定 的 文件 路 径 名 逐 
个 分 量 地 去 查找 目录 ， 通 过 多 次 读 盘 操 作 才 能 找到 该 文件 的 索引 结 点 ， 而 用 硬 链 接 的 共享 文件 
的 目录 文件 表 目 中 已 包括 了 共享 文件 的 索引 结 点 号 。 


2. 文件 的 保护 


文件 系统 对 文件 的 保护 常 采用 存 取 控制 方式 进行 。 所 谓 存 取 控 制 ， 就 是 不 同 的 用 户 对 文件 
的 访问 规定 不 同 的 权限 ， 以 防止 文件 被 未 经 文件 主 同意 的 用 户 访问 。 

(1) 存 取 控 制 矩 阵 。 理 论 上 ， 存 取 控 制 方法 可 用 存 取 控制 矩阵 ， 它 是 一 个 二 维 矩 阵 ， 一 维 
列 出 计算 机 的 全 部 用 户 ， 另 一 维 列 出 系统 中 的 全 部 文件 ， 和 矩阵 中 的 每 个 元 素 4 表示 第 i 个 用 户 
对 第 7 个 文件 的 存 取 权 限 。 通 常 ， 存 取 权 限 有 可 读 及 、 可 写 W、 可 执行 和 以 及 它们 的 组 合 ， 如 
表 4-5 所 示 。 


表 4-5 存 取 控 制 矩阵 
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存 取 控 制 矩阵 在 概念 上 是 简单 、 清 楚 的 ， 但 在 实现 上 却 有 困难 。 当 一 个 系统 用 户 数 和 文件 
数 很 大 时 ， 二 维 矩阵 要 占 很 大 的 存储 空间 ， 验 证 过 程 也 将 耗费 许多 系统 时 间 。 

(2) 存 取 控 制 表 。 存 取 控 制 矩 阵 由 于 太 大 往往 无 法 实现 。 一 个 改进 的 办 法 是 按 用 户 对 文件 
的 访问 权力 的 差别 对 用 户 进行 分 类 ， 由 于 某 一 文件 往往 只 与 少数 几 个 用 户 有 关 ， 所 以 这 种 分 类 
方法 可 使 存 取 控 制 表 大 大 简化 。UNIX 系统 就 是 使 用 了 这 种 存 取 控 制 表 方法 。 它 把 用 户 分 成 三 
类 : 文件 主 、 同 组 用 户 和 其 他 用 户 ， 每 类 用 户 的 存 取 权限 为 可 读 、 可 写 、 可 执行 以 及 它们 的 组 
合 。 在 用 ls 长 列表 显示 时 ， 每 组 存 取 权 限 用 3 个 字母 R、W、 义 表示， 如 果 读 、 写 和 执行 中 哪 
一 样 存 取 都 不 允许 ， 则 用 “-” 字 符 表示 。 用 ls -1 长 列表 显示 ls 文件 如 下 


-I-xI-xI-t 1 bin bin 43296 May 13 1997 /opt/K/SCO/Unix/5.0.4Eb/bin/ls 


显示 前 2 一 10 共 9 个 字符 表示 文件 的 存 取 权 限 ， 每 3 个 字符 为 一 组 ， 分 别 表示 文件 主 、 同 
组 用 户 和 其 他 用 户 的 存 取 权 限 。 由 于 存 取 控制 表 对 每 个 文件 按 用 户 分 类 ， 所 以 该 存 取 控制 表 可 
存放 在 每 个 文件 的 文件 控制 块 中 ,对 UNIX 只 需 9 位 二 进 制 来 表示 三 类 用 户 对 文件 的 存 取 权 限 ， 
该 权限 存在 文件 索引 结 点 的 di_mode 中 。 

(3) 用 户 权 限 表 。 改 进 存 取 控制 矩阵 的 另 一 种 方法 是 以 用 户 或 用 户 组 为 单位 将 用 户 可 存 取 
的 文件 集中 起 来 存 入 表 中 ， 这 称 为 用 户 权限 表 。 表 中 的 每 个 表 目 表示 该 用 户 对 应 文件 的 存 取 权 
限 ， 这 相当 于 存 取 控制 矩阵 一 行 的 简化 。 

(4) 密码 。 在 创建 文件 时 ， 由 用 户 提供 一 个 密码 ， 在 文件 存 入 磁盘 时 用 该 密码 对 文件 内 容 
加 密 。 在 进行 读 取 操作 时 ， 要 对 文件 进行 解密 ， 只 有 知道 密码 的 用 户 才能 读 取 文件 。 


4.5.7 ”系统 的 安全 与 可 靠 性 
1.， 系统 的 安全 


系统 的 安全 涉及 两 类 不 同 的 问题 ， 一 类 涉及 技术 、 管 理 、 法 律 、 道 德 和 政治 等 问题 ， 另 一 
类 涉及 操作 系统 的 安全 机 制 。 随 着 计算 机 应 用 范围 扩大 ， 在 所 有 稍 具 规 模 的 系统 中 都 从 多 个 级 
别 上 来 保证 系统 的 安全 性 。 一 般 从 4 个 级 别 上 对 文件 进行 安全 性 管理 : 系统 级 、 用 户 级 、 目 录 
级 和 文件 级 。 

系统 级 安全 管理 的 主要 任务 是 不 允许 未 经 授权 的 用 户 进入 系统 ， 从 而 也 防止 了 他 人 非法 使 
用 系统 中 各 类 资源 〈 包 括 文件 )。 系 统 级 管理 的 主要 措施 有 注册 与 登录 。 

用 户 级 安全 管理 是 通过 对 所 有 用 户 分 类 和 对 指定 用 户 分 配 访问 权 , 不 同 的 用 户 对 不 同文 件 
设置 不 同 的 存 取 权限 来 实现 。 例 如 ， 在 UNIX 系统 中 将 用 户 分 为 文件 主 、 组 用 户 和 其 他 用 户 。 
有 的 系统 将 用 户 分 为 超级 用 户 、 系 统 操作 员 和 一 般 用 户 。 
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目录 级 安全 管理 是 为 了 保护 系统 中 各 种 目录 而 设计 的 ， 它 与 用 户 权限 无 关 。 为 了 保证 目录 
的 安全 ， 规 定 只 有 系统 核心 才 具 有 写 目 录 的 权利 。 

文件 级 安全 管理 是 通过 系统 管理 员 或 文件 主 对 文件 属性 的 设置 来 控制 用 户 对 文件 的 访问 。 
通常 可 设置 以 下 儿 种 属性 : 只 执行 、 隐 含 、 只 读 、 读 / 写 、 共 享 、 系 统 。 用 户 对 文件 的 访问 ， 将 
由 用 户 访问 权 、 目 录 访 问 权限 及 文件 属性 三 者 的 权限 所 确定 ， 或 者 说 是 有 效 权限 和 文件 属性 的 
交集 。 例 如 对 于 只 读 文件 ， 尽 管用 户 的 有 效 权 限 是 读 / 写 ， 但 都 不 能 对 只 读 文件 进行 修改 、 更 名 
和 删除 。 对 于 一 个 非 共享 文件 ， 将 禁止 在 同一 时 间 内 由 多 个 用 户 对 它们 进行 访问 。 

通过 上 述 4 级 文件 保护 措施 ， 可 有 效 地 对 文件 进行 保护 。 


2. 文件 系统 的 可 靠 性 


文件 系统 的 可 靠 性 是 指 系统 抵抗 和 预防 各 种 物理 性 破坏 和 人 为 性 破坏 的 能 力 。 比 起 计算 机 
的 损坏 ， 文 件 系统 破坏 往往 后 果 更 加 严重 。 例 如 ， 将 开水 撤 在 键盘 上 引起 的 故障 ， 尽 管 伤 脑筋 
但 毕竟 可 以 修复 ;但 如 果 文 件 系统 被 破坏 了 ， 在 很 多 情况 下 是 无 法 恢复 的 。 特 别 是 对 于 那些 程 
序 文件 、 客 户 档案 、 市 场 计划 或 其 他 数据 文件 丢失 的 客户 来 说 ， 这 不 亚 于 一 场 大 的 灾难 。 尽 管 
文件 系统 无 法 防止 设备 和 存储 介质 的 物理 损坏 ， 但 至 少 应 能 保护 信息 。 

(1) 转 储 和 恢复 。 在 文件 系统 中 无 论 是 硬件 或 软件 都 会 发 生 损 坏 和 错误 ， 例 如 自然 界 的 内 
电 、 电 压 的 突变 、 火 灾 和 水 灾 等 均 可 能 引起 软 /硬件 的 破坏 。 为 了 使 文件 系统 万 无 一 失 ， 应 当 采 
用 相应 的 措施 ， 最 简单 和 常用 的 措施 是 通过 转 储 操作 形成 文件 或 文件 系统 的 多 个 副本 。 这 样 ， 
一 旦 系统 出 现 故 障 ， 利 用 转 储 的 数据 使 得 系统 恢复 成 为 可 能 。 常 用 的 转 储 方法 有 静态 转 储 和 动 
态 转 储 、 海 量 转 储 和 增 量 转 储 。 

(2) 日 志文 件 。 在 计算 机 系统 的 工作 过 程 中 ， 操 作 系统 把 用 户 对 文件 的 插入 、 删 除 和 修改 
操作 写 入 日 志文 件 。 一 旦 发 生 故 障 ， 操 作 系统 恢复 子 系统 利用 日 志文 件 来 进行 系统 故障 恢复 ， 
并 可 协助 后 备 副 本 进行 介质 故障 恢复 。 

(3) 文件 系统 的 一 致 性 。 影 响 文 件 系统 可 靠 性 的 因素 之 一 是 文件 系统 的 一 致 性 问题 。 很 多 
文件 系统 是 先 读 取 磁 盘 块 到 主 在， 在 主 存 进行 修改 ， 修 改 完毕 再 写 回 磁盘 。 但 如 果 读 取 某 磁盘 
块 ， 修 改 后 再 将 信息 写 回 磁盘 前 系统 崩溃 ， 则 文件 系统 就 可 能 会 出 现 不 一 致 性 状态 。 如 果 这 些 
未 被 写 回 的 磁盘 块 是 索引 结 点 块 、 目 录 块 或 空闲 块 ， 那 么 后 果 是 不 堪 设 想 的 。 通 常 ， 解 决 方案 
是 采用 文件 系统 的 一 致 性 检查 ， 一 致 性 检查 包括 块 的 一 致 性 检查 和 文件 的 一 致 性 检查 。 


4.6 ”作业 管理 


作业 是 系统 为 完成 一 个 用 户 的 计算 任务 〈 或 一 次 事务 处 理 ) 所 做 的 工作 总 和 。 例 如 ， 对 用 
户 编写 的 源 程序 ， 需 要 经 过 编译 、 连 接 、 装 入 以 及 执行 等 步骤 得 到 结果 ， 这 其 中 的 每 一 个 步骤 


第 4 章 操作 系统 知识 


称 为 作业 步 。 在 操作 系统 中 用 来 控制 作业 进入 、 执 行 和 撤销 的 一 组 程序 称 为 作业 管理 程序 。 操 
作 系 统 可 以 进一步 为 每 个 作业 创建 作业 步 进程 ， 完 成 用 户 的 工作 。 


4.6.1 作业 与 作业 控制 
1， 作 业 控 制 


通常 ， 可 以 采用 脱 机 和 联机 两 种 控制 方式 控制 用 户 作业 的 运行 。 在 脱 机 控制 方式 中 ， 作 业 
运行 的 过 程 是 无 须 人 工 干预 的 ， 因 此 ， 用 户 必 须 将 自己 想 让 计算 机 干什么 的 意图 用 作业 控制 语 
言 (JCL) 编写 成 作业 说 明 书 ， 连 同 作业 一 起 提交 给 计算 机 系统 。 在 联机 控制 方式 中 ， 操 作 系 
统 向 用 户 提供 了 一 组 联机 命令 ， 用 户 可 以 通过 终端 输入 命令 将 自己 想 让 计算 机 干什么 的 意图 告 
诉 计算 机 ， 以 控制 作业 的 运行 过 程 ， 因 此 整个 作业 的 运行 过 程 需要 人 工 干预 。 

作业 由 程序 、 数 据 和 作业 说 明 书 3 个 部 分 组 成 。 作 业 说 明 书 包括 作业 基本 情况 、 作 业 控制 、 
作业 资源 要 求 的 描述 ， 它 体现 用 户 的 控制 意图 。 其 中 ， 作 业 基 本 情况 包括 用 户 名 、 作 业 名 、 编 
程 语 言 和 最 大 处 理 时 间 等 ， 作 业 控 制 描述 包括 作业 控制 方式 、 作 业 步 的 操作 顺序 、 作 业 执 行 出 
错 处 理 ， 作 业 资 源 要 求 描述 包括 处 理 时 间 、 优 先 级 、 主 存 空间 、 外 设 类 型 和 数量 等 。 


2. 作业 状态 及 转换 


作业 状态 分 为 4 种: 提交 、 后 备 、 执 行 和 完成 。 

(1) 提交 。 作 业 提 交 给 计算 机 中 心 ， 通 过 输入 设备 送 入 计算 机 系统 的 过 程 状态 称 为 提交 状态 。 

(2) 后 备 。 通 过 Spooling 系统 将 作业 输入 到 计算 机 系统 的 后 备 存储 器 〈 磁 盘 ) 中 ， 随 时 等 
待 作业 调度 程序 调度 时 的 状态 。 

(3) 执行 。 一 旦 作业 被 作业 调度 程序 选中 ， 为 其 分 配 了 必要 的 资源 ， 并 为 其 建立 相应 的 进 
程 后 ， 该 作业 便 进 入 了 执行 状态 。 

(4) 完成 。 当 作业 正常 结束 或 异常 终止 时 ， 作 业 进入 完成 状态 。 此 时 ， 由 作业 调度 程序 对 
该 作业 进行 善后 处 理 。 如 撤销 作业 的 作业 控制 块 ， 收 回 作业 所 占 的 系统 资源 ， 将 作业 的 执行 结 
果 形 成 输出 文件 放 到 输出 井中 ， 由 Spooling 系统 控制 输出 。 

作业 的 状态 及 转换 如 图 4-31 所 示 。 


3. 作业 控制 块 和 作业 后 备 队 列 


所 谓 作 业 控 制 块 (JCB)， 是 记录 与 该 作业 有 关 的 各 种 信息 的 登记 表 。JCB 是 作业 存在 的 唯 
一 标志 ， 包 括 用 户 名 、 作 业 名 和 状态 标志 等 信息 。 

由 于 在 输入 井中 有 较 多 的 后 备 作 业 ， 为 了 便于 作业 调度 程序 调度 ， 通 常 将 作业 控制 块 排 成 
一 个 或 多 个 队列 ， 而 这 些 队列 称 为 作业 后 备 队列 。 也 就 是 说 ， 作 业 后 备 队 列 是 由 若干 个 JCB 组 
成 的 。 
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图 4-31 作业 的 状态 及 其 转换 


4.6.2 ”作业 调度 


选择 调度 算法 需要 考虑 如 下 因素 : 与 系统 的 整个 设计 目标 一 致 ， 均 衡 地 使 用 系统 资源 ， 以 
及 平衡 系统 和 用 户 的 要 求 。 对 于 用 户 来 说 ， 作 业 能 “立即 执行 ”往往 难以 做 到 ， 但 是 应 保证 进 
入 系统 的 作业 在 规定 的 截止 时 间 内 完成 ， 而 且 系统 应 设法 缩短 作业 的 平均 周转 时 间 。 


1， 作 业 调度 算法 


常用 的 作业 调度 算法 如 下 。 
(1) 先 来 先 服务 。 按 作业 到 达 的 先后 进行 调度 ， 即 启动 等 待 时 间 最 长 的 作业 。 
(2) 短 作 业 优 先 。 以 要 求 运行 时 间 的 长 短 进行 调度 ， 即 启动 要 求 运行 时 间 最 短 的 作业 。 
(3) 响应 比 高 优先 。 响 应 比 高 的 作业 优先 启动 。 
定义 响应 比如 下 : 
,一 作业 响应 时 间 
? 作业 执行 时 间 
其 中 ， 作 业 响 应 时 间 为 作业 进入 系统 后 的 等 候 时 间 与 作业 的 执行 时 间 之 和 ， 即 
作业 等 待 时 间 ， 
作业 执行 时 间 

对 于 响应 比 高 者 优先 算法 ， 在 每 次 调度 前 都 要 计算 所 有 被 选 作 业 《〈 在 作业 后 备 队 列 中 ) 的 
响应 比 ， 然 后 选择 响应 比 最 高 的 作业 执行 。 该 算法 比较 复杂 ， 系 统 开 销 大 。 

(4) 优先 级 调度 算法 。 可 由 用 户 指定 作业 优先 级 ， 优 先 级 高 的 作业 先 启动 。 也 可 由 系统 根 
据 作 业 要 求 的 紧迫 程度 ， 或 者 照顾 “IO 繁忙 ”的 作业 ， 以 便 充 分 发 挥 外 设 的 效率 等 。 

(5) 均衡 调度 算法 。 这 种 算法 的 基本 思想 是 根据 系统 的 运行 情况 和 作业 本 身 的 特性 对 作业 
进行 分 类 。 作 业 调度 程序 轮流 地 从 这 些 不 同类 别 的 作业 中 挑选 作业 执行 。 这 种 算法 力求 均衡 地 
使 用 系统 的 各 种 资源 ， 即 注意 发 挥 系 统 效率 ， 又 使 用 户 满意 。 
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【 例 4.19】 作 业 寻 、T2、J3 的 提交 时 间 和 所 需 运行 时 间 如 下 表 所 示 。 若 采用 响应 比 高 
者 优先 调度 算法 ， 则 作业 调度 次 序 为 _QD) _。 


作业 号 提交 时 间 | 运行 时 间 (分 钟 ) | 
本 6:00 30 
4 6:20 20 
B 6:25 6 
(1) A.JT1—12—]3 BIT-B-R CCI-N-B3 DJ] 


分 析 : 空 (1) 的 正确 答案 是 B。 根据 题 意 有 3 个 作业 刁 、 了 有、 了 3， 它 们 到 达 输 入 井 的 
时 间 分 别 为 6:00、6:20、6:25， 它 们 需要 执行 的 时 间 分 别 为 30 分 钟 、20 分 钟 、6 分 钟 。 若 
采用 响应 比 高 者 优先 算法 对 它们 进行 调度 ， 那 么 ， 系 统 在 6:00 时 ， 因 为 系统 输入 井中 只 有 
作业 1， 因此 刀 1 先 运行 。6:30 当 作 业 刀 运行 完毕 时 ， 先 计算 作业 卫 和 73 的 响应 比 ， 然 
后 令 响应 比 高 者 运行 。 

响应 比 = 作业 周转 时 间 / 作 业 运行 时 间 

=1+ 作 业 等 待 时 间 / 作 业 运 行 时 间 

作业 了 的 响应 比 =1+10 /20=1.5 

作业 73 的 响应 比 =1+5/6=1.83 

按照 响应 比 高 者 优先 算法 ， 优 先 调度 13。 

综 上 分 析 可 知 ， 作 业 被 选中 执行 的 次 序 应 是 1 一 J3 一 了 2。 

2， 作业 调度 算法 性 能 的 衡量 指标 


在 一 个 以 批量 处 理 为 主 的 系统 中 , 通常 用 平均 周转 时 间或 平均 带 权 周 转 时 间 来 衡量 调度 性 
能 的 优 和 劣 。 假 设 作业 工 (i=1,2,…,n) 的 提交 时 间 为 态 ， 执 行 时间 为 ; ， 作 业 完 成 时 间 为 总 ， 则 
作业 二 的 周转 时 间 工 和 带 权 周 转 时 间 丙 分别 定义 为 : 

于 = 向 -在 Ci=L2D, W=T/t (i=L2,,n) 
n 个 作业 的 平均 周转 时 间 了 和 平均 带 权 周转 时 间 球 分 别 定义 为 : 
te 1 
iD 

从 用 户 的 角度 来 说 ， 总 是 希望 自己 的 作业 在 提交 后 能 立即 执行 ， 这 意味 着 当 等 待 时 间 为 0 
时 作业 的 周转 时 间 最 短 , 即 工 =#;。 但 是 , 作业 的 执行 时 间 志 ,并 不 能 直观 地 衡量 出 系统 的 性 能 ， 
而 带 权 周转 时 间 环 却 能 直观 地 反映 系统 的 调度 性 能 。 从 整个 系统 的 角度 来 说 ,不 可 能 满足 每 个 
用 户 的 这 种 要 求 ， 而 只 能 是 系统 的 平均 周转 时 间或 平均 带 权 周转 时 间 最 小 。 
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4.6.3 ”用 户 界面 


用 户 界面 (User Interface) 是 计算 机 中 实现 用 户 与 计算 机 通信 的 软 /硬件 部 分 的 总 称 。 用 户 
界面 也 称 用 户 接口 ， 或 人 机 界面 。 

用 户 界 面 的 硬件 部 分 包括 用 户 向 计算 机 输入 数据 或 命令 的 输入 装置 ， 以 及 由 计算 机 输出 供 
用 户 观察 或 处 理 的 输出 装置 。 用 户 界 面 的 软件 部 分 包括 用 户 与 计算 机 相互 通信 的 协议 、 约 定 、 
操纵 命令 及 其 处 理 软件 。 目 前 ， 常 用 的 输入 /输出 装置 有 键盘 、 鼠 标 、 显 示 器 和 打印 机 等 。 常 用 
的 人 机 通信 方法 有 命令 语言 、 选 项 、 表 格 填充 及 直接 操纵 等 。 从 计算 机 用 户 界 面 的 发 展 过 程 来 
看 ， 用 户 界 面 可 分 为 如 下 阶段 。 

(1) 控制 面板 式 用 户 界 面 。 这 是 计算 机 发 展 早期 ， 用 户 通过 控制 台 开 关 、 板 键 或 穿孔 纸 带 
向 计算 机 送 入 命令 或 数据 ， 而 计算 机 通过 指示 灯 及 打印 机 输出 运行 情况 或 结果 。 这 种 界面 的 特 
点 是 人 去 适应 现在 看 来 十 分 笨拙 的 计算 机 。 

(2) 字符 用 户 界面 。 字 符 用 户 界 面 是 基于 字符 型 的 ， 用 户 通过 键盘 或 其 他 输入 设备 输入 字 
符 ， 由 显示 器 或 打印 机 输出 字符 。 字 符 用 户 界 面 的 优点 是 功能 强 、 灵 活性 好 、 屏 幕 开销 少 ; 缺 
点 是 操作 步骤 烦琐 ， 学 会 操作 也 较 费 时 。 

(3) 图 形 用 户 界面 。 随 着 文字 、 图 形 、 声 音 和 图 像 等 多 媒体 技术 的 出 现 ， 各 种 图 形 用 户 界 
面 应 运 而 生 ， 用 户 既 可 使 用 传统 的 字符 ， 也 可 使 用 图 形 、 图 像 和 声音 同 计算 机 进行 交互 ， 操 作 
将 更 加 自然 、 更 加 方便 。 现 代 界 面 的 关键 技术 是 超 文本 。 超 文本 的 “ 超 ” 体 现在 它 不 仅 包括 文 
本 ， 还 包括 图 像 、 音 频 和 视频 等 多 媒体 信息 ， 即 将 文本 的 概念 扩充 到 超 文本 ， 超 文本 的 最 大 特 
点 是 具有 指向 性 。 

(4) 新 一 代用 户 界面 。 虚 拟 现 实 技术 将 用 户 界面 的 发 展 推 向 一 个 新 阶段 ; 人 将 作为 参与 
者 ， 以 自然 的 方式 与 计算 机 生成 的 虚拟 环境 进行 通信 。 以 用 户 为 中 心 、 自 然 、 高 效 、 高 带 
宽 、 非 精确 、 无 地 点 限制 等 是 新 一 代用 户 界面 的 特征 。 多 媒体 、 多 通道 及 智能 化 是 新 一 代 
用 户 界面 的 技术 支持 。 语 音 、 自 然 语言 、 手 势 、 头 部 跟踪 、 表 情 和 视线 跟踪 等 新 的 、 更 加 
自然 的 交互 技术 将 为 用 户 提供 更 方便 的 输入 技术 。 计 算 机 将 通过 多 种 感知 通道 来 理解 用 户 
的 意图 ， 实 现 用 户 的 要 求 。 计 算 机 不 仅 以 二 维 屏幕 向 用 户 输出 ， 而 且 以 真实 感 〈 立 体 视觉 、 
听觉 、 嗅 觉 和 触觉 等 ) 的 计算 机 仿真 环境 向 用 户 提供 真实 的 体验 。 
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本 章 介绍 软件 工程 的 相关 基础 知识 ， 主 要 内 容 包括 软件 过 程 与 过 程 模型 、 需 求 分 析 、 软 件 
设计 、 软 件 测试 、 软 件 运行 与 维护 、 软 件 项 目 管理 、 软 件 质量 、 软 件 度量 、 软 件 工具 与 软件 开 
发 环境 等 相关 知识 。 


5.1 软件 工程 概述 


早期 的 软件 主要 指 程序 ， 程 序 的 开发 采用 个 体 工作 方式 ， 开 发 工作 主要 依赖 于 开发 人 员 的 
个 人 技能 和 程序 设计 技巧 。 当 时 的 软件 通常 缺少 与 程序 有 关 的 文档 ， 软 件 开发 的 实际 成 本 和 进 


着 计算 机 应 用 需求 的 不 断 增长 ， 软 件 的 规模 也 越 来 越 大 ， 然 而 软件 开发 的 生产 率 远 远 跟 不 上 计 
算 机 应 用 的 迅速 增长 。 此 外 ， 由 于 软件 开发 时 缺少 好 的 方法 指导 和 工具 辅助 ， 同 时 又 缺少 相关 
文档 ， 使 得 大 量 已 有 的 软件 难以 维护 。 上 述 这 些 问 题 严重 地 阻碍 了 软件 的 发 展 ，20 世纪 60 年 
代 中 期 ， 人 们 把 上 述 软件 开发 和 维护 过 程 中 所 遇 到 的 各 种 问题 称 为 “软件 危机 ”。 

1968 年 ， 在 德国 召开 的 NATO (North Atlantic Treaty Organization， 北 大 西洋 公约 组 织 ) 会 
议 上 首次 提出 了 “软件 工程 ”这 个 名 词 ， 希 望 用 工程 化 的 原则 和 方法 来 克服 软件 危机 。 在 此 以 
后 ， 人 们 开展 了 软件 开发 模型 、 开 发 方法 、 工 具 与 环境 的 研究 ， 提 出 了 瀑布 模型 、 演 化 模型 、 
螺旋 模型 和 喷泉 模型 等 开发 模型 ， 出 现 了 面向 数据 流 方法 、 面 向 数据 结构 的 方法 、 面 向 对 象 方 
法 等 开发 方法 , 以 及 一 批 CASE (Computer Aided Software Engineering, 计算 机 辅助 的 软件 工程 
工具 和 环境 。 现在， 软件 工程 已 经 成 为 计算 机 软件 的 一 个 重要 分 支 和 研究 方向 。 

软件 工程 是 指 应 用 计算 机 科学 、 数 学 及 管理 科学 等 原理 (如 图 5-1 所 示 )， 以 工程 化 的 原 
则 和 方法 来 解决 软件 问题 的 工程 ， 其 目的 是 提高 软件 生产 率 、 提 高 软件 质量 、 降 低 软 件 成 本 。 
软件 工程 涉及 软件 开发 、 维 护 、 管 理 等 多 方面 的 原理 、 方 法 、 工 具 与 环境 ， 限 于 篇 幅 ， 本 章 不 
能 对 软件 工程 做 全 面 的 介绍 。 根 据 软件 设计 考试 大 纲 的 要 求 ， 本 章 着 重 介 绍 软件 开发 过 程 中 的 
原理 ， 其 他 内 容 只 做 简单 的 介绍 。 


软件 开发 方法 学 
软件 开发 技术 { 软件 工具 

软件 工程 环境 
软件 工程 管理 学 
软件 经 济 学 


图 5-1 软件 工程 学 的 范畴 


软件 工程 学 | 
软件 工程 管理 二 
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5.1.1 计算 机 软件 


计算 机 软件 是 指 计 算 机 系统 中 的 程序 及 其 文档 。 程序 是 计算 任务 的 处 理 对 象 和 处 理 规则 的 
描述 。 任 何以 计算 机 为 处 理工 具 的 任务 都 是 计算 任务 。 处 理 对 象 是 数据 (如 数字 、 文 字 、 图 形 、 
图 像 、 声 音 等 ， 它 们 只 是 表示 ， 而 无 含义 ) 或 信息 (数据 及 有 关 的 含义 )。 处 理 规则 一 般 指 处 
理 的 动作 和 步 又。 文档 是 为 了 便于 了 解 程序 所 需 的 阐述 性 资料 。 

按照 软件 的 应 用 领域 ， 可 以 将 计算 机 软件 分 为 十 大 类 。 


1. 系统 软件 


系统 软件 是 一 整套 服务 于 其 他 程序 的 程序 。 某 些 系统 软件 处 理 复杂 但 是 确定 的 信息 结构 。 
另 一 些 系统 应 用 程序 〈 如 操作 系统 构件 、 驱 动 程序 、 网 络 软件 、 远 程 通信 处 理 器 ) 主要 处 理 的 
是 不 确定 的 数据 。 无 论 何 种 情况 ， 系 统 软件 多 具有 以 下 特点 : 和 计算 机 硬件 大 量 交互 ; 多 用 户 
大 量 使 用 ， 需 要 调度 、 资 源 共享 和 复杂 进程 管理 的 同步 操作 ;复杂 的 数据 结构 以 及 多 种 外 部 
接口 。 

2. 应 用 软件 


应 用 软件 是 解决 特定 业务 需要 的 独立 应 用 程序 。 这 类 应 用 软件 处 理 商 务 或 技术 数据 ， 以 协 
助 业务 操作 和 管理 或 技术 决策 。 除 了 传统 数据 处 理 的 应 用 程序 ， 应 用 软件 也 被 用 于 业务 功能 的 
实时 控制 例如 销售 点 的 交易 处 理 、 实 时 制造 过 程控 制 等 )。 

3. 工程 /科学 软件 

这 类 软件 通常 带 有 “数值 计算 ”算法 的 特征 。 工 程 /科学 软件 涵盖 了 广泛 的 应 用 领域 ， 从 天 
文学 到 火山 学 ， 从 自动 应 力 分 析 到 航天 飞机 轨道 动力 学 ， 从 分 子 生物 学 到 自动 制造 业 。 不 过 ， 
当今 科学 工程 领域 的 应 用 软件 已 经 不 仅仅 局 限于 传统 的 数值 算法 ， 计 算 机 辅助 设计 、 系 统 仿真 
和 其 他 的 交互 性 应 用 程序 已 经 呈现 出 实时 性 甚至 具有 系统 软件 的 特性 。 


4. 骨 入 式 软件 


嵌入 式 软件 存在 于 某 个 产品 或 系统 中 ,可 实现 和 控制 面向 最 终 使 用 者 和 系统 本 身 的 特性 和 
功能 。 嵌 入 式 软件 可 以 执行 有 限 但 难于 实现 的 功能 〈 例 如 ， 微 波 炉 的 按键 控制 ) 或 者 提供 重要 
的 功能 和 控制 能 力 〔 例 如 ， 汽 车 中 的 燃油 控制 、 仪 表 板 显示 、 刹 车 系统 等 汽车 电子 功能 )。 


5. 产品 线 软件 
产品 为 多 个 不 同 用 户 的 使 用 提供 特定 功能 。 产 品 线 软件 关注 有 限 的 特定 专业 市 场 〈 例 如 库 
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存 控制 产品 ) 或 大 众 消费 品 市 场 〈 例 如 ， 文 字 处 理 、 多 媒体 、 娱 乐 、 数 据 库 管 理 等 )。 

6. Web 应 用 

Web 应 用 (WebApp) 是 一 类 以 网 络 为 中 心 的 软件 ， 其 概念 涵盖 了 宽泛 的 应 用 程序 产品 。 
最 简单 可 以 是 一 组 超 文本 链接 文件 ， 仅 仅 用 文本 和 有 限 的 图 形 表达 信息 。 然 而 ， 随 着 Web 2.0 
的 出 现 ， 网 络 应 用 正在 发 展 为 复杂 的 计算 环境 ， 不 仅 为 最 终 用 户 提供 独立 的 特性 、 计 算 功 能 和 
内 容 信息 ， 还 与 企业 数据 库 和 商务 应 用 程序 相 结合 。 绝 大 多 数 WebApp 具备 网 络 密集 性 、 并 发 
性 、 无 法 预知 的 负载 量 、 性 能 、 可 用 性 和 数据 驱动 属性 。 


7. 人 工 智 能 软件 

人 工 智能 软件 利用 非 数值 算法 解决 计算 和 直接 分 析 无 法 解决 的 复杂 问题 。 这 个 领域 的 应 用 
包括 机 器 人 、 专 家 系统 、 模 式 识别 、 人 工 神经 网 络 、 定 理 证 明和 博弈 等 。 

8. 开放 计算 


无 线 网 络 的 快速 发 展 将 促成 真正 的 普 适 计算 、 分 布 式 计算 的 实现 。 软 件 工程 师 所 面临 的 挑 
战 是 如 何 开发 系统 和 应 用 软件 ， 以 使 移动 设备 、 个 人 电脑 和 企业 应 用 可 以 通过 大 量 的 网 络 设施 
进行 通信 。 

9. 网 络 资源 


现在 , 万维网 已 经 快速 发 展 为 一 个 计算 引擎 和 内 容 提供 平台 。 软 件 工程 师 面临 的 新 任务 是 
构建 一 个 简单 而 智能 的 应 用 程序 ， 为 全 世界 的 最 终 用 户 市 场 提供 服务 。 


10. 开源 软件 

开源 软件 就 是 开放 系统 应 用 程序 的 代码 ， 使 得 很 多 人 能 够 为 软件 开发 做 贡献 ， 这 种 方式 正 
在 逐步 成 为 一 种 趋势 。 软 件 工程 师 面临 的 挑战 是 开发 可 以 自我 描述 的 代码 ， 更 重要 的 是 开发 某 
种 技术 ， 以 便于 用 户 和 开发 人 员 都 能 够 了 解 已 经 发 生 的 改动 ， 并 且 知 道 这 些 改动 如 何在 软件 中 
体现 出 来 。 


5.1.2 软件 工程 基本 原理 


美国 著名 的 软件 工程 专家 B.WBoehm 于 1983 年 提出 了 软件 工程 的 7 条 基本 原理 。Boehm 
认为 这 7 条 原理 是 确保 软件 产品 质量 和 开发 效率 的 原理 的 最 小 集合 。 
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1. 用 分 阶段 的 生命 周期 计划 严格 管理 


有 统计 表明 ，509%6 以 上 的 失败 项 目 是 由 于 计划 不 周 造成 的 。 在 软件 开发 与 维护 的 漫长 生命 
周期 中 ， 需 要 完成 许多 各 种 各 样 的 工作 。 这 条 基本 原理 意味 着 应 该 把 软件 生命 周期 划分 成 若干 
个 阶段 ， 并 相应 地 制订 出 切实 可 行 的 计划 ， 然 后 严格 按照 计划 对 软件 的 开发 与 维护 工作 进行 管 
理 。Boehm 认为 ， 在 软件 的 整个 生存 周期 中 应 该 制定 并 严格 执行 六 类 计划 : 项 目 概要 计划 、 里 
程 碑 计划 、 项 目 控制 计划 、 产 品 控制 计划 、 验 证 计划 和 运行 维护 计划 。 

2. 坚持 进行 阶段 评审 


据 统计 结果 显示 ， 大 部 分 错误 是 在 编码 之 前 造成 的 。 根 据 Boehm 等 人 的 统计 ， 设 计 错 误 
占 软 件 错误 的 63%， 编 码 错误 仅 占 37%， 而 且 错误 发 现 与 改正 得 越 晚 ， 所 需 付 出 的 代价 越 高 。 
因此 ， 在 每 个 阶段 都 应 进行 严格 的 评审 ， 以 便 尽 早 发 现在 软件 开发 过 程 中 所 犯 的 错误 。 


3. 实现 严格 的 产品 控制 


在 软件 开发 过 程 中 不 应 随意 改变 需求 ， 因 为 改变 一 项 需求 需要 付出 较 高 的 代价 。 但 是 ， 在 
软件 开发 过 程 中 改变 需求 又 是 难免 的 ， 由 于 外 部 环境 的 变化 ， 相 应 地 改变 用 户 需 求 是 一 种 客观 
需要 ， 这 就 要 采用 科学 的 产品 控制 技术 来 顺应 这 种 要 求 。 在 改变 需求 时 ， 为 了 保持 软件 各 个 配 
置 成 分 的 一 致 性 ， 必 须 实行 严格 的 产品 控制 ， 其 中 主要 是 实行 基准 配置 管理 。 基 准 配置 又 称 为 
基线 配置 ， 它 是 经 过 阶段 评审 后 的 软件 配置 成 分 (各 个 阶段 产生 的 文档 或 程序 代码 )。 基 准 配 
置 管理 也 称 为 变动 控制 ， 一 切 有 关 修 改 软件 的 建议 ， 特 别 是 涉及 基准 配置 的 修改 建议 ， 都 必须 
按照 严格 的 规程 进行 评审 ， 在 获得 批准 以 后 才能 实施 修改 。 


4. 采用 现代 程序 设计 技术 


从 20 世纪 60 年 代 和 70 年 代 的 结构 化 软件 开发 技术 到 面向 对 象 技 术 ， 从 第 一 代 、 第 二 代 
语言 到 第 四 代 语 言 ， 人 们 已 经 充分 认识 到 : 方法 大 于 力气 。 采 用 先进 的 技术 既 可 以 提高 软件 开 
发 的 效率 ， 又 可 以 降低 软件 维护 的 成 本 。 

5. 结果 应 能 清楚 地 审查 

软件 是 一 种 看 不 见 、 摸 不 着 的 逻辑 产品 。 软 件 开发 小 组 的 工作 进展 情况 可 见 性 差 ， 难以 评 


价 和 管理 。 为 了 更 好 地 进行 管理 ， 应 根据 软件 开发 的 总 目标 及 完成 期 限 尽量 明确 地 规定 开发 小 
组 的 责任 和 产品 标准 ， 从 而 使 所 得 到 的 结果 能 够 清楚 地 审查 。 
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6. 开发 小 组 的 人 员 应 少 而 精 


开发 人 员 的 素质 和 数量 是 影响 软件 质量 和 开发 效率 的 重要 因素 ， 应 该 少 而 精 。 这 一 条 基于 
两 点 原因 : 高 素质 开发 人 员 的 效率 比 低 素质 开发 人 员 的 效率 要 高 几 倍 到 几 十 倍 ， 开 发 工作 中 犯 
的 错误 也 要 少 得 多 ， 当 开发 小 组 为 Y 人 时 ， 可 能 的 通信 信道 为 MN-1)/2。 可 见 ， 随 着 人 数 入 的 
增 大 ， 通 信 开 销 将 急剧 增 大 。 


7. 承认 不 断 改 进 软件 工程 实践 的 必要 性 


遵循 上 述 6 条 基本 原理 ， 就 能 够 按照 当代 软件 工程 基本 原理 实现 软件 的 工程 化 生产 。 但 是 
它们 只 是 对 现 有 经 验 的 总 结 和 归纳 ， 并 不 能 保证 软件 开发 与 维护 的 过 程 能 赶 上 时 代 前 进 的 步 
伐 ， 能 跟 上 技术 的 不 断 进 步 。 因 此 ，Boehm 提出 应 把 “承认 不 断 改进 软件 工程 实践 的 必要 性 
作为 软件 工程 的 第 7 条 原理 。 根 据 这 条 原理 ， 用 户 不 仅 要 积极 采纳 新 的 软件 开发 技术 ， 还 要 注 
意 不 断 总 结 经 验 ， 收 集 进度 和 消耗 等 数据 ， 进 行 出 错 类 型 和 问题 报告 统计 。 这 些 数据 既 可 以 用 
来 评估 新 的 软件 技术 的 效果 ， 也 可 以 用 来 指明 必须 着 重 注意 的 问题 和 应 该 优先 进行 研究 的 工具 
和 技术 。 


5.1.3 ”软件 生存 周期 


与 其 他 事物 一 样 ， 一 个 软件 产品 或 软件 系统 也 要 经 历 孕 育 、 诞 生 、 成 长 、 成 熟 、 衰 亡 的 许 
多 阶段 ， 一 般 称 为 软件 生存 周期 。 把 整个 软件 生存 周期 划分 为 若干 阶段 ， 使 得 每 个 阶段 有 明确 
的 任务 ， 使 规模 大 、 结 构 复杂 和 管理 复杂 的 软件 的 开发 变 得 容易 控制 和 管理 。 通 常 ， 软 件 生存 
周期 包括 可 行 性 分 析 与 项 目 开发 计划 、 需 求 分 析 、 设 计 概 要 设计 和 详细 设计 )、 编 码 、 测 试 、 
维护 等 活动 ， 可 以 将 这 些 活 动 以 适当 的 方式 分 配 到 不 同 的 阶段 去 完成 。 

1. 可 行 性 分 析 与 项 目 开发 计划 


这 个 阶段 主要 确定 软件 的 开发 目标 及 其 可 行 性 。 必 须要 回答 的 问题 是 : 要 解决 的 问题 是 什 
么 ? 该 问题 有 可 行 的 解决 办 法 吗 ? 若 有 解决 的 办 法 ， 则 需要 多 少 费用 ? 需要 多 少 资源 ? 需要 多 
少时 间 ? 要 回答 这 些 问题 ， 就 要 进行 问题 定义 、 可 行 性 分 析 ， 制 订 项 目 开发 计划 。 

可 行 性 分 析 与 项 目 计划 阶段 的 参加 人 员 有 用 户 、 项 目 负 责 人 和 系统 分 析 师 。 该 阶段 产生 的 
主要 文档 有 可 行 性 分 析 报 告 和 项 目 开发 计划 。 


2. 需求 分 析 


需求 分 析 阶 段 的 任务 不 是 具体 地 解决 问题 ， 而 是 准确 地 确定 软件 系统 必须 做 什么 ， 确 定 软 
件 系统 的 功能 、 性 能 、 数 据 和 界面 等 要 求 ， 从 而 确定 系统 的 逻辑 模型 。 该 阶段 的 参加 人 员 有 用 
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户 、 项 目 负责 人 和 系统 分 析 师 。 该 阶段 产生 的 主要 文档 有 软件 需求 说 明 书 。 
3. 概要 设计 


在 概要 设计 阶段 ， 开 发 人 员 要 把 确定 的 各 项 功能 需求 转换 成 需要 的 体系 结构 。 在 该 体系 结 
构 中 ， 每 个 成 分 都 是 意义 明确 的 模块 ， 即 每 个 模块 都 和 某 些 功能 需求 相对 应 ， 因 此 ， 概 要 设计 
就 是 设计 软件 的 结构 ， 明 确 软件 由 哪些 模块 组 成 ， 这 些 模块 的 层次 结构 是 怎样 的 ， 这 些 模块 的 
调用 关系 是 怎样 的 ， 每 个 模块 的 功能 是 什么 。 同 时 ， 还 要 设计 该 项 目的 应 用 系统 的 总 体 数据 结 
构 和 数据 库 结构 ， 即 应 用 系统 要 存储 什么 数据 ， 这 些 数据 是 什么 样 的 结构 ， 它 们 之 间 有 什么 


关系 。 
概要 设计 阶段 的 参加 和 人员 有 系统 分 析 师 和 软件 设计 师 。 该 阶段 产生 的 主要 文档 有 概要 设计 
说 明 书 。 


4. 详细 设计 


详细 设计 阶段 的 主要 任务 是 对 每 个 模块 完成 的 功能 进行 具体 描述 , 要 把 功能 描述 转变 为 精 
确 的 、 结 构 化 的 过 程 描述 。 即 该 模块 的 控制 结构 是 怎样 的 ， 先 做 什么 ， 后 做 什么 ， 有 什么 样 的 
条 件 判定 ， 有 些 什么 重复 处 理 等 ， 并 用 相应 的 表示 工具 把 这 些 控制 结构 表示 出 来 。 

详细 设计 阶段 的 参加 人 员 有 软件 设计 师 和 程序 员 。 该 阶段 产生 的 主要 文档 有 详细 设计 文档 。 

S. 编码 

编码 阶段 就 是 把 每 个 模块 的 控制 结构 转换 成 计算 机 可 接受 的 程序 代码 ， 即 写成 某 种 特定 程 
序 设计 语言 表示 的 源 程序 清单 。 

6. 测试 

测试 是 保证 软件 质量 的 重要 手段 , 其 主要 方式 是 在 设计 测试 用 例 的 基础 上 检查 软件 的 各 个 
组 成 部 分 。 测 试 阶段 的 参加 人 员 通 常 是 另 一 部 门 〈 或 单位 ) 的 软件 设计 师 或 系统 分 析 师 。 该 阶 
段 产生 的 主要 文档 有 软件 测试 计划 、 测 试用 例 和 软件 测试 报告 。 

7. 维护 


软件 维护 是 软件 生存 周期 中 时 间 最 长 的 阶段 。 已 交付 的 软件 投入 正式 使 用 后 ， 便 进入 软件 
维护 阶段 ， 它 可 以 持续 几 年 甚至 几 十 年 。 在 软件 运行 过 程 中 可 能 由 于 各 方面 的 原因 需要 对 它 进 
行 修改 ， 其 原因 可 能 是 运行 中 发 现 了 软件 隐 含 的 错误 而 需要 修改 ; 也 可 能 是 为 了 适应 变化 了 的 
软件 工作 环境 而 需要 做 适当 变更 ; 也 可 能 是 因为 用 户 业 务 发 生变 化 而 需要 扩充 和 增强 软件 的 功 
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能 ， 还 可 能 是 为 将 来 的 软件 维护 活动 做 预先 准备 等 。 
5.1.4 ”软件 过 程 


在 开发 产品 或 构建 系统 时 ， 遵 循 一 系列 可 预测 的 步骤 〈 即 路 线 图 ) 是 非常 重要 的 ， 它 有 助 
于 及 时 交付 高 质量 的 产品 。 软 件 开发 中 所 遵循 的 路 线 图 称 为 “软件 过 程 ”。 过 程 是 活动 的 集合 ， 
活动 是 任务 的 集合 。 软 件 过 程 有 3 层 含义 : 一 个 是 个 体 含义 ， 即 指 软 件 产品 或 系统 在 生存 周期 
中 的 某 一 类 活动 的 集合 ， 如 软件 开发 过 程 、 软 件 管理 过 程 等 ; 二 是 整体 含义 ， 即 指 软件 产品 或 
系统 在 所 有 上 述 含义 下 的 软件 过 程 的 总 体 ; 三 是 工程 含义 ， 即 指 解决 软件 过 程 的 工程 ， 应 用 软 
件 的 原则 、 方 法 来 构造 软件 过 程 模型 ， 并 结合 软件 产品 的 具体 要 求 进行 实例 化 ， 以 及 在 用 户 环 
境 下 的 运作 ， 以 此 进一步 提高 软件 的 生产 率 ， 降 低 成 本 。 


1. 能 力 成 熟 度 模型 CMM) 


自从 软件 工程 概念 提出 以 后 ， 出 现 了 许多 开发 、 维 护 软件 的 模型 、 方 法 、 工 具 和 环境 ， 它 
们 对 提高 软件 的 开发 、 维 护 效率 和 质量 起 到 了 很 大 的 作用 。 尽 管 如 此 ， 人 们 开发 和 维护 软件 的 
能 力 仍然 跟 不 上 软件 所 涉及 问题 的 复杂 程度 的 增长 ， 软 件 组 织 面临 的 主要 问题 仍然 是 无 法 开发 
出 符合 预算 和 进度 要 求 的 高 可 靠 性 和 高 可 用 性 的 软件 。 人 们 开始 意识 到 问题 的 实质 是 缺乏 管理 
软件 过 程 的 能 力 。 

在 美国 国防 部 的 支持 下 ，1987 年 ， 卡 内 基 * 梅 隆 大 学 软件 工程 研究 所 率先 推出 了 软件 工程 
评估 项 目的 研究 成 果 一 一 软件 过 程 能 力 成 熟 度 模型 (Capability Maturity Model of Software， 
CMM)， 其 研究 目的 是 提供 一 种 评价 软件 承接 方 能 力 的 方法 ， 同 时 它 可 帮助 软件 组 织 改进 其 软 
件 过 程 。 

CMM 是 对 软件 组 织 进 化 阶段 的 描述 ， 随 着 软件 组 织 定义 、 实 施 、 测 量 、 控 制 和 改进 其 软 
件 过 程 ， 软 件 组 织 的 能 力 经 过 这 些 阶 段 逐步 提高 。 该 能 力 成 熟 度 模型 使 软件 组 织 能 够 较 容 易 地 
确定 其 当前 过 程 的 成 熟 度 并 识别 其 软件 过 程 执行 中 的 薄弱 环节 ， 确 定 对 软件 质量 和 过 程 改进 最 
为 关键 的 几 个 问题 ， 从 而 形成 对 其 过 程 的 改进 策略 。 软 件 组 织 只 要 关注 并 认真 实施 一 组 有 限 的 
关键 实践 活动 ， 就 能 稳步 地 改善 其 全 组 织 的 软件 过 程 ， 使 全 组 织 的 软件 过 程 能 力 持续 增长 。 

CMM 将 软件 过 程 改进 分 为 以 下 5 个 成 熟 度 级 别 。 

1) 初始 级 (Initial) 

软件 过 程 的 特点 是 杂乱 无 章 ， 有 时 甚至 很 混乱 ， 几 乎 没有 明确 定义 的 步骤 ， 项 目的 成 功 完 
全 依赖 个 人 的 努力 和 英雄 式 核心 人 物 的 作用 。 

2) 可 重复 级 (Repeatable) 

建立 了 基本 的 项 目 管理 过 程 和 实践 来 跟踪 项 目 费用 、 进 度 和 功能 特性 ， 有 必要 的 过 程 准则 
来 重复 以 前 在 同类 项 目 中 的 成 功 。 
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3) 已 定义 级 (Defined) 

管理 和 工程 两 方面 的 软件 过 程 已 经 文档 化 、 标 准 化 ， 并 综合 成 整个 软件 开发 组 织 的 标准 软 
件 过 程 。 所 有 项 目 都 采用 根据 实际 情况 修改 后 得 到 的 标准 软件 过 程 来 开发 和 维护 软件 。 

4) 已 管理 级 (Managed) 

制定 了 软件 过 程 和 产品 质量 的 详细 度量 标准 。 软 件 过 程 的 产品 质量 都 被 开发 组 织 的 成 员 所 
理解 和 控制 。 

5) 优化 级 (Optimized) 

加 强 了 定量 分 析 ， 通 过 来 自 过 程 质量 反馈 和 来 自 新 观念 、 新 技术 的 反馈 使 过 程 能 不 断 持续 
地 改进 。 

CMM 模型 提供 了 一 个 框架 ， 将 软件 过 程 改进 的 进化 步骤 组 织 成 5 个 成 熟 度 等 级 ， 为 过 程 
不 断 改 进 黄 定 了 循序 渐进 的 基础 。 这 5 个 成 熟 度 等 级 定义 了 一 个 有 序 的 尺度 ， 用 来 测量 一 个 组 
织 的 软件 过 程 成 熟 度 和 评价 其 软件 过 程 能 力 。 成 熟 度 等 级 是 已 得 到 确切 定义 的 ， 也 是 在 向 成 熟 
软件 组 织 前 进 途 中 的 平台 。 每 一 个 成 熟 度 等 级 为 继续 改进 过 程 提供 一 个 基础 。 每 一 个 等 级 包含 
一 组 过 程 目标 ， 通 过 实施 相应 的 一 组 关键 过 程 域 达 到 这 一 组 过 程 目标 ， 当 目标 满足 时 ， 能 使 软 
件 过 程 的 一 个 重要 成 分 稳定 。 每 达到 成 熟 度 框架 的 一 个 等 级 ， 就 建立 起 软件 过 程 的 一 个 相应 成 
分 ， 使 得 组 织 过 程 能 力 有 一 定 程度 的 增长 。 

基于 CMM 模型 的 产品 包括 一 些 诊断 工具 ， 可 应 用 于 软件 过 程 评价 和 软件 能 力 评估 小 组 ， 
以 确定 一 个 机 构 的 软件 过 程 实力 、 弱 点 和 风险 。 最 著名 的 是 成 熟 度 调查 表 。 软 件 过 程 评价 及 软 
件 能 力 评 估 的 方法 及 培训 也 依赖 于 CMM 模型 。 


2. 能 力 成 熟 度 模型 集成 CMMI) 


CMM 的 成 功 导致 了 适用 不 同学 科 领 域 的 模型 的 衍生 ， 如 系统 工程 的 能 力 成 熟 度 模型 ， 适 
用 于 集成 化 产品 开发 的 能 力 成 熟 度 模型 等 。 而 一 个 工程 项 目 又 往往 涉及 多 个 交叉 的 学 科 ， 因 此 
有 必要 将 各 种 过 程 改进 的 工作 集成 起 来 。1998 年 ， 由 美国 产业 界 、 政 府 和 卡 内 基 “。 梅 隆 大 学 软 
件 工程 研究 所 共同 主持 CMMI 项 目 。CMMI 是 若干 过 程 模型 的 综合 和 改进 ， 是 支持 多 个 工程 学 
科 和 和 领域 的 、 系 统 的 、 一 致 的 过 程 改进 框架 ， 能 适应 现代 工程 的 特点 和 需要 ， 能 提高 过 程 的 质 
量 和 工作 效率 。2000 年 发 布 了 CMMI-SE/SW/IPPD， 集 成 了 适用 于 软件 开发 的 SW-CMM ( 草 
案 版 本 2(C))、 适 用 于 系统 工程 的 EIA/IS731 以 及 适用 于 集成 化 产品 和 过 程 开 发 的 了 PD CMM 
(0.98 版 )。2002 年 1 月 发 布 了 CMMI-SE/SW/IPPD 1.1 版 。 

CMMI 提供 了 两 种 表示 方法 : 阶段 式 模型 和 连续 式 模型 。 

1) 阶段 式 模型 

阶段 式 模型 的 结构 类 似 于 CMM， 它 关注 组 织 的 成 熟 度 。CMMI-SE/SW/IPPD 1.1 版 中 有 5 
个 成 熟 度 等 级 。 
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初始 的 :过 程 不 可 预测 且 缺 乏 控 制 。 
已 管理 的 : 过 程 为 项 目 服务 。 

已 定义 的 : 过 程 为 组 织 服务 。 

定量 管理 的 : 过 程 已 度量 和 控制 。 
优化 的 : 集中 于 过 程 改进 。 


2) 连续 式 模型 

连续 式 模型 关注 每 个 过 程 域 的 能 力 ， 一 个 组 织 对 不 同 的 过 程 域 可 以 达到 不 同 的 过 程 域 能 力 
等 级 (Capability Level，CL)。CMMI 中 包括 6 个 过 程 域 能 力 等 级 ， 等 级 号 为 0 一 5。 能力 等 级 
包括 共性 目标 及 相关 的 共性 实践 ， 这 些 实践 在 过 程 域内 被 添加 到 特定 目标 和 实践 中 。 当 组 织 满 
足 过 程 域 的 特定 目标 和 共性 目标 时 ， 就 说 该 组 织 达到 了 那个 过 程 域 的 能 力 等 级 。 

能 力 等 级 可 以 独立 地 应 用 于 任何 单独 的 过 程 域 ， 任 何 一 个 能 力 等 级 都 必须 满足 比 它 等 级 低 
的 能 力 等 级 的 所 有 准则 。 对 各 能 力 等 级 的 含义 简 述 如 下 。 


CLo( 未 完成 的 ): 过 程 域 未 执行 或 未 得 到 CL 中 定义 的 所 有 目标 。 

CL1 (已 执行 的 ): 其 共性 目标 是 过 程 将 可 标识 的 输入 工作 产品 转换 成 可 标识 的 输出 工 
作 产品 ， 以 实现 支持 过 程 域 的 特定 目标 。 

CLs (已 管理 的 ): 其 共性 目标 集中 于 已 管理 的 过 程 的 制度 化 。 根 据 组 织 级 政策 规定 过 
程 的 运作 将 使 用 哪个 过 程 ， 项 目 遵循 已 文档 化 的 计划 和 过 程 描述 ,所 有 正在 工作 的 人 
都 有 权 使 用 足够 的 资源 ， 所 有 工作 任务 和 工作 产品 都 被 监控 、 控 制 和 评审 。 

CL (已 定义 级 的 ): 其 共性 目标 集中 于 已 定义 的 过 程 的 制度 化 。 过 程 是 按照 组 织 的 剪 
裁 指 南 从 组 织 的 标准 过 程 集中 剪裁 得 到 的 ， 还 必须 收集 过 程 资 产 和 过 程 的 度量 ， 并 用 
CL4 (定量 管理 的 ): 其 共性 目标 集中 于 可 定量 管理 的 过 程 的 制度 化 。 使 用 测量 和 质量 
保证 来 控制 和 改进 过 程 域 ， 建 立 和 使 用 关于 质量 和 过 程 执行 的 定量 目标 作为 管理 
准则 。 

CLs〔 优 化 的 ): 使 用 量化 (统计 学 ) 手段 改变 和 优化 过 程 域 ， 以 满足 客户 要 求 的 改变 
和 持续 改进 计划 中 的 过 程 域 的 功效 。 


5.2 ”软件 过 程 模型 


软件 过 程 模型 习惯 上 也 称 为 软件 开发 模型 ， 它 是 软件 开发 全 部 过 程 、 活 动 和 任务 的 结构 杠 
架 。 典 型 的 软件 过 程 模型 有 瀑布 模型 、 增 量 模型 、 演 化 模型 〈 原 型 模型 、 螺 旋 模 型 )、 喷 泉 模 
型 、 基 于 构件 的 开发 模型 和 形式 化 方法 模型 等 。 
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5.2.1 瀑布 模型 ( Waterfall Model ) 


瀑布 模型 是 将 软件 生存 周期 中 的 各 个 活动 规定 为 依 线性 顺序 连接 的 若干 阶段 的 模型 , 包括 
需求 分 析 、 设 计 、 编 码 、 测 试 、 运 行 与 维护 。 它 规定 了 由 前 至 后 、 相 互 衔接 的 固定 次 序 ， 如 同 
瀑布 流水 逐 级 下 落 ， 如 图 5-2 所 示 。 

瀑布 模型 为 软件 的 开发 和 维护 提供 了 一 种 有 效 
的 管理 模式 ， 根 据 这 一 模式 制定 开发 计划 ， 进 行 成 本 
预算 ， 组 织 开发 力量 ， 以 项 目的 阶段 评审 和 文档 控制 
为 手段 有 效 地 对 整个 开发 过 程 进行 指导 ， 所 以 它 是 以 
文档 作为 驱动 、 适 合 于 软件 需求 很 明确 的 软件 项 目的 

瀑布 模型 假设 ， 一 个 待 开发 的 系统 需求 是 完整 
的 、 简 明 的 、 一 致 的 ， 而 且 可 以 先 于 设计 和 实现 完成 
之 前 产生 。 图 5-2 瀑布 模型 

瀑布 模型 的 一 个 变 体 是 V 模型 ， 如 图 5-3 所 示 。 
V 模型 描述 了 质量 保证 活动 和 沟通 、 建 模 相关 活动 以 及 早期 构建 相关 的 活动 之 间 的 关系 。 随 着 
软件 团队 工作 沿 着 V 模型 左 侧 步 又 向 下 推进 ,基本 问题 需求 逐步 细 化 ， 形 成 问题 及 解决 方案 的 
技术 描述 。 一 旦 编码 结束 ， 团 队 沿 着 V 模型 右 侧 的 步骤 向 上 推进 工作 ， 其 实际 上 是 执行 了 一 系 
列 测试 (质量 保证 活动 )， 这 些 测试 验证 了 团队 沿 着 V 模型 左 侧 步骤 向 下 推进 过 程 中 所 生成 的 
每 个 模型 。V 模型 提供 了 一 种 将 验证 确认 活动 应 用 于 早期 软件 工程 工作 中 的 方法 。 


图 5-3 V 模 型 
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瀑布 模型 的 优点 是 ， 容 易 理 解 ， 管 理 成 本 低 ; 强调 开发 的 阶段 性 早期 计划 及 需求 调查 和 产 
品 测试 。 不 足 之 处 是 ， 客 户 必须 能 够 完整 、 正 确 和 清晰 地 表达 他 们 的 需要 ; 在 开始 的 两 个 或 3 
个 阶段 中 ， 很 难 评估 真正 的 进度 状态 ， 当 接近 项 目 结束 时 ， 出 现 了 大 量 的 集成 和 测试 工作 ， 直 
到 项 目 结束 之 前 ， 都 不 能 演示 系统 的 能 力 。 在 瀑布 模型 中 ， 需 求 或 设计 中 的 错误 往往 只 有 到 了 
项 目 后 期 才能 够 被 发 现 ， 对 于 项 目 风险 的 控制 能 力 较 弱 ， 从 而 导致 项 目 常常 延期 完成 ， 开 发 费 
用 超出 预算 。 


5.2.2” 增 量 模型 (Incremental Model ) 


增 量 模型 融合 了 瀑布 模型 的 基本 成 分 和 原型 实现 的 迭代 特征 ， 它 假设 可 以 将 需求 分 段 为 一 
系列 增 量 产品 ， 每 一 增 量 可 以 分 别 开 发 。 该 模型 采用 随 着 日 程 时 间 的 进展 而 交错 的 线性 序列 ， 
每 一 个 线性 序列 产生 软件 的 一 个 可 发 布 的 “ 增 量 ” 如 图 5-4 所 示 。 当 使 用 增 量 模型 时 ， 第 1 个 
增 量 往往 是 核心 的 产品 。 客 户 对 每 个 增 量 的 使 用 和 评估 都 作为 下 一 个 增 量 发 布 的 新 特征 和 功 
能 ， 这 个 过 程 在 每 一 个 增 量 发 布 后 不 断 重复 ， 直 到 产生 了 最 终 的 完善 产品 。 增 量 模型 强调 每 一 
个 增 量 均 发 布 一 个 可 操作 的 产品 。 


图 5-4 增 量 模型 


增 量 模型 作为 瀑布 模型 的 一 个 变 体 ， 具 有 瀑布 模型 的 所 有 优点 。 此 外 ， 它 还 有 以 下 优点 
第 一 个 可 交付 版 本 所 需要 的 成 本 和 时 间 很 少 ; 开发 由 增 量 表示 的 小 系统 所 承担 的 风险 不 大 ; 由 
于 很 快 发 布 了 第 一 个 版 本 ， 因 此 可 以 减少 用 户 需 求 的 变更 ;运行 增 量 投资 ， 即 在 项 目 开始 时 ， 
可 以 仅 对 一 个 或 两 个 增 量 投资 。 

增 量 模型 有 以 下 不 足 之 处 : 如 果 没 有 对 用 户 的 变更 要 求 进行 规划 ， 那 么 产生 的 初始 增 量 可 
会 造成 后 来 增 量 的 不 稳定 ; 如 果 需 求 不 像 早 期 思考 的 那样 稳定 和 完整 ， 那 么 一 些 增 量 就 可 能 
需要 重新 开发 ， 重 新 发 布 ; 管理 发 生 的 成 本 、 进 度 和 配置 的 复杂 性 可 能 会 超出 组 织 的 能 力 。 
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5.2.3 ”演化 模型 ( Evolutionary Model ) 


软件 类 似 于 其 他 复杂 的 系统 ， 会 随 着 时 间 的 推移 而 演化 。 在 开发 过 程 中 ， 常 常会 面临 以 下 
情形 : 商业 和 产品 需求 经 常 发 生变 化 ， 直 接 导致 最 终 产 品 难以 实现 ， 严 格 的 交付 时 间 使 得 开发 
团队 不 可 能 圆满 地 完成 软件 产品 ， 但 是 必须 交付 功能 有 限 的 版 本 以 应 对 竞争 或 商业 压力 ; 很 好 
地 理解 了 核心 产品 和 系统 需求 ， 但 是 产品 或 系统 扩展 的 细节 问题 却 没 有 定义 。 在 上 述 情况 和 类 
似 情况 下 ， 软 件 开 发 人 员 需 要 一 种 专门 应 对 不 断 演 变 的 软件 产品 的 过 程 模型 。 

演化 模型 是 迭代 的 过 程 模型 ， 使 得 软件 开发 人 员 能 够 逐步 开发 出 更 完整 的 软件 版 本 。 演 化 
模型 特别 适用 于 对 软件 需求 缺乏 准确 认识 的 情况 。 典 型 的 演化 模型 有 原型 模型 和 螺旋 模型 等 。 


1. 原型 模型 (Prototype Model) 


并 非 所 有 的 需求 都 能 够 预先 定义 ， 大 量 的 实践 表明 ， 在 开发 初期 很 难得 到 一 个 完整 的 、 准 
确 的 需求 规格 说 明 。 这 主要 是 由 于 客户 往往 不 能 准确 地 表达 对 未 来 系统 的 全 面 要 求 ， 开 发 者 对 
要 解决 的 应 用 问题 模糊 不 清 ， 以 至 于 形成 的 需求 规格 说 明 常常 是 不 完整 的 、 不 准确 的 ， 有 时 其 
至 是 有 歧义 的 。 此 外 ， 在 整个 开发 过 程 中 ， 用 户 可 能 会 产生 新 的 要 求 ， 导 致 需求 的 变更 。 而 梁 
布 模型 难以 适应 这 种 需求 的 不 确定 性 和 变化 ， 于 是 出 现 了 快速 原型 《Rapid Prototype) 这 种 新 
的 开发 方法 。 原 型 方法 比较 适合 于 用 户 需 求 不 清 、 需 求 经 常 变化 的 情况 。 当 系统 规模 不 是 很 大 
也 不 太 复 杂 时 ， 采 用 该 方法 比较 好 。 

原型 是 预期 系统 的 一 个 可 执行 版 本 ， 反 映 了 系统 性 质 的 一 个 选 定 的 子 集 。 一 个 原型 不 必 汪 
是 目标 软件 的 所 有 约束 ， 其 目的 是 能 快速 、 低 成 本 地 
构建 原型 当然， 能够 采用 原型 方法 是 因为 开发 工具 
的 快速 发 展 ， 使 得 能 够 迅速 地 开发 出 一 个 让 用 户 看 得 
见 、 摸 得 着 的 系统 框架 。 这 样 ， 对 于 计算 机 不 是 很 
悉 的 用 户 就 可 以 根据 这 个 框架 提出 自己 的 需求 。 开 发 
原型 系统 首先 确定 用 户 需 求 ， 开 发 初始 原型 ， 然 后 征 
求 用 户 对 初始 原型 的 改进 意见 ， 并 根据 意见 修改 原 
型 。 原 型 模型 如 图 5-5 所 示 。 

原型 模型 开始 于 沟通 ， 其 目的 是 定义 软件 的 总 体 
目标 ， 标 识 需求 ， 然 后 快速 制订 原型 开发 的 计划 ， 确 局 
定 原型 的 目标 和 范围 ， 采 用 快速 射击 的 方式 对 其 进行 
建 模 ， 并 构建 原型 。 被 开发 的 原型 应 交付 给 客户 使 用 ， 并 收集 客户 的 反馈 意见 ， 这 些 反 馈 意见 
可 在 下 一 轮 中 对 原型 进行 改进 。 在 前 一 个 原型 需要 改进 ， 或 者 需要 扩展 其 范围 的 时 候 ， 进 入 下 
一 轮 原型 的 迁 代 开发 。 
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根据 使 用 原型 的 目的 不 同 ， 原 型 可 以 分 为 探索 型 原型 、 实 验 型 原型 和 演化 型 原型 3 种 。 探 
索 型 原型 的 目的 是 要 弄 清 目 标的 要 求 ， 确 定 所 希望 的 特性 ， 并 探讨 多 种 方案 的 可 行 性 。 实 验 型 
原型 的 目的 是 验证 方案 或 算法 的 合理 性 ， 是 在 大 规模 开发 和 实现 前 ， 用 于 考查 方案 是 否 合适 、 
规格 说 明 是 否 可 靠 等 。 演 化 型 原型 的 目的 是 将 原型 作为 目标 系统 的 一 部 分 ， 通 过 对 原型 的 多 次 
改进 ， 逐 步 将 原型 演化 成 最 终 的 目标 系统 。 


2. 螺旋 模型 (Spiral Model) 


对 于 复杂 的 大 型 软件 ， 开 发 一 个 原型 往往 达 不 到 要 求 。 螺 旋 模 型 将 瀑布 模型 和 演化 模型 结 
合 起 来 ， 加 入 了 两 种 模型 均 忽略 的 风险 分 析 ， 弥 补 了 这 两 种 模型 的 不 足 。 

螺旋 模型 将 开发 过 程 分 为 几 个 螺旋 周期 ， 每 个 螺旋 周期 大 致 和 瀑布 模型 相符 合 ， 如 图 5-6 
所 示 。 每 个 螺旋 周期 分 为 如 下 4 个 工作 步骤 。 

(1) 制订 计划 。 确 定 软件 的 目标 ， 选 定 实施 方案 ， 明 确 项 目 开发 的 限制 条 件 。 

(2) 风险 分 析 。 分 析 所 选 的 方案 ， 识 别 风 险 ， 消 除 风险 。 

(3) 实施 工程 。 实 施 软 件 开 发 ， 验 证 阶段 性 产品 。 

(4) 用 户 评估 。 评 价 开发 工作 ， 提 出 修正 建议 ， 建 立 下 一 个 周期 的 开发 计划 。 
累计 


制订 计划 成 本 风险 分 析 
决定 目标 、 评价 
方案 和 限制 调 


确认 


设计 
与 验证 


用 户 评估 
图 5-6 ”螺旋 模型 


螺旋 模型 强调 风险 分 析 ， 使 得 开发 人 员 和 用 户 对 每 个 演化 层 出 现 的 风险 有 所 了 解 ， 从 而 做 
出 应 有 的 反应 。 因 此 ， 该 模型 特别 适用 于 庞大 、 复 杂 并 且 具 有 高 风险 的 系统 。 
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与 瀑布 模型 相 比 ， 螺 旋 模 型 支持 用 户 需求 的 动态 变化 ， 为 用 户 参 与 软件 开发 的 所 有 关键 决 
策 提供 了 方便 ， 有 助 于 提高 软件 的 适应 能 力 ， 并 且 为 项 目 管理 人 员 及 时 调整 管理 决策 提供 了 便 
利 ， 从 而 降低 了 软件 开发 的 风险 。 在 使 用 螺旋 模型 进行 软件 开发 时 ， 需 要 开发 人 员 具 有 相当 丰 
富 的 风险 评估 经 验 和 专门 知识 。 另 外 ， 过 多 的 迭代 次 数 会 增加 开发 成 本 ， 延 迟 提交 时 间 。 
5.2.4 “喷泉 模型 (Water Fountain Model ) 

喷泉 模型 是 一 种 以 用 户 需 求 为 动力 , 以 对 象 作 为 驱动 的 模型 , 适合 于 面向 对 象 的 开发 方法 。 
它 克服 了 瀑布 模型 不 支持 软件 重用 和 多 项 开发 活动 集成 的 局 限 性 。 


喷泉 模型 使 开发 过 程 具 有 和 连 代 性 和 无 间隙 性 ， 如 图 5-7 所 示 。 达 代 
意味 着 模型 中 的 开发 活动 常常 需要 重复 多 次 ， 在 迭代 过 程 中 不 断 地 


完善 软件 系统 。 无 间隙 是 指 在 开发 活动 (如 分 析 、 设 计 、 编 码 ) 之 护 
间 不 存在 明显 的 边界 ， 也 就 是 说 ， 它 不 像 瀑布 模型 那样 ， 在 需求 分 
析 活 动 结束 后 才 开 始 设计 活动 , 在 设计 活动 结束 后 才 开 始 编码 活动 ， 实现 


而 是 允许 各 开发 活动 交叉 、 迭 代 地 进行 。 

喷泉 模型 的 各 个 阶段 没有 明显 的 界线 , 开发 人 员 可 以 同步 进行 。 
其 优点 是 可 以 提高 软件 项 目的 开发 效率 ， 节 省 开发 时 间 。 由 于 喷泉 
模型 在 各 个 开发 阶段 是 重合 的 , 在 开发 过 程 中 需要 大 量 的 开发 人 员 ， 
不 利于 项 目的 管理 。 此 外 ， 这 种 模型 要 求 严格 管理 文档 ， 使 得 审核 
的 难度 加 大 。 


5.2.5 ”基于 构件 的 开发 模型 ( Component-based Development Model ) 


基于 构件 的 开发 是 指 利用 预先 包装 的 构件 来 构造 应 用 系统 。 构 件 可 以 是 组 织 内 部 开发 的 构 
件 ， 也 可 以 是 商品 化 成 品 (Commercial Off-The-Shelf，COTS ) 软件 构件 。 基 于 构件 的 开发 模型 
具有 许多 螺旋 模型 的 特点 , 它 本 质 上 是 演化 模型 ,需要 以 迭代 方式 构建 软件 。 其 不 同 之 处 在 于 ， 
基于 构件 的 开发 模型 采用 预先 打包 的 软件 构件 开发 应 用 系统 。 

一 种 基于 构建 的 开发 模型 如 图 5-8 所 示 ， 包 括 领域 工程 和 应 用 系统 工程 两 部 分 。 

领域 工程 的 目的 是 构建 领域 模型 、 领 域 基准 体系 结构 和 可 复 用 构件 库 。 为 达到 此 目的 ， 首 
先 要 进行 领域 分 析 ， 分 析 该 领域 中 各 种 应 用 系统 的 公共 部 分 或 相似 部 分 ， 构 建 领域 模型 和 领域 
基准 体系 结构 ， 表 示 领 域 的 候选 构件 ， 对 候选 构件 进行 可 变性 分 析 ， 以 适应 多 个 应 用 系统 的 需 
要 ， 最 后 构建 可 复 用 构件 ， 经 严格 测试 和 包装 后 存 入 可 复 用 构件 库 。 

应 用 系统 工程 的 目的 是 使 用 可 复 用 构件 组 装 应 用 系统 。 首 先进 行 应 用 系统 分 析 ， 设 计 应 用 
系统 的 体系 结构 ， 标 识 应 用 系统 所 需 的 构件 ， 然 后 在 可 复 用 构件 库 中 查找 合适 的 构件 (也 可 以 
购买 第 三 方 构件 )， 这 些 选取 的 构件 需 进行 特 化 ， 必 要 时 做 适当 的 修改 ， 以 适应 该 应 用 系统 的 


图 5-7 喷泉 模型 


第 5 章 软件 工程 基础 知识 


需要 。 对 于 那些 未 找到 合适 构件 的 应 用 部 分 ， 仍 需 单独 开发 ， 并 将 其 与 特 化 修改 后 的 构件 组 装 
成 应 用 系统 。 在 此 过 程 中 ， 还 需要 对 可 复 用 构件 的 复 用 情况 进行 评价 ， 以 改进 可 复 用 构件 ， 同 
时 对 新 开发 的 部 分 进行 评价 ， 并 向 领域 工程 推荐 候选 构件 。 


构件 组 装 
和 测试 


开发 未 找到 构 
件 的 部 分 


应 用 系统 工程 


图 5-8 ”基于 构件 的 开发 模型 


5.2.6 ”形式 化 方法 模型 ( Formal Methods Model ) 


形式 化 方法 是 建立 在 严格 数学 基础 上 的 一 种 软件 开发 方法 ,其 主要 活动 是 生成 计算 机 软件 
形式 化 的 数学 规格 说 明 。 

形式 化 方法 用 严格 的 数学 语言 和 语义 描述 功能 规约 和 设计 规约 ， 通 过 数学 的 分 析 和 推导 
易于 发 现 需求 的 歧义 性 、 不 完整 性 和 不 一 致 性 ， 易 于 对 分 析 模 型 、 设 计 模型 和 程序 进行 验证 。 
通过 数学 的 演算 ， 使 得 从 形式 化 功能 规约 到 形式 化 设计 规约 ， 以 及 从 形式 化 设计 规约 到 程序 代 
人 码 的 转换 成 为 可 能 。 这 种 方法 的 一 个 变形 是 净 室 软件 工程 。 


5.2.7 统一 过 程 (UP ) 模型 


统一 过 程 模 型 是 一 种 “用 例 和 风险 驱动 ， 以 架构 为 中 心 ， 和 迭代 并 且 增 量 ” 的 开发 过 程 ， 由 
UML 方法 和 工具 支持 。 迭 代 的 意思 是 将 整个 软件 开发 项 目 划分 为 许多 个 小 的 “袖珍 项 目 "， 每 
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个 “袖珍 项 目 ” 都 包含 正常 软件 项 目的 所 有 元 素 : 计划 、 分 析 和 设计 、 构 造 、 集 成 和 测试 ， 以 
及 内 部 和 外 部 发 布 。 

统一 过 程 定 义 了 4 个 技术 阶段 及 其 制品 。 

1) 起 始 阶段 (Inception Phase) 

起 始 阶段 专注 于 项 目的 初创 活动 ， 产 生 的 主要 工作 产品 有 构想 文档 〈Vision Document)、 
初始 用 例 模型 、 初 始 项 目 术 语 表 、 初 始 业 务 用 例 、 初 始 风险 评估 、 项 目 计划 《阶段 及 迭代 )、 
业务 模型 以 及 一 个 或 多 个 原型 (需要 时 )。 

2) 精 化 阶段 ‘Elaboration Phase) 

精华 阶段 在 理解 了 最 初 的 领域 范围 之 后 进行 需求 分 析 和 架构 演进 , 产生 的 主要 工作 产品 有 
用 例 模型 、 补 充 需 求 〈 包 括 非 功能 需求 )、 分 析 模型 、 软 件 体系 结构 描述 、 可 执行 的 软件 体系 
结构 原型 、 初 步 的 设计 模型 、 修 订 的 风险 列表 、 项 目 计划 《〈 包 括 和 迭代 计划 、 调 整 的 工作 流 、 里 
程 碑 和 技术 工作 产品 ) 以 及 初始 用 户 手册 。 

3) 构建 阶段 (Construction Phase) 

构建 阶段 关注 系统 的 构建 ， 产 生 实 现 模 型 ， 产 生 的 主要 工作 产品 有 设计 模型 、 软 件 构件 、 
集成 的 软件 增 量 、 测 试 计 划 及 步骤 、 测 试用 例 以 及 支持 文档 〈 用 户 手册 、 安 装 手册 和 对 于 并 发 
增 量 的 描述 )。 

4) 移交 阶段 (Transition Phase) 

移交 阶段 关注 于 软件 提交 方面 的 工作 ， 产 生 软 件 增 量 ， 产 生 的 主要 工作 产品 有 提交 的 软件 
增 量 、B 测试 报告 和 综合 用 户 反 馈 。 

每 次 迭代 产生 包括 最 终 系统 的 部 分 完成 的 版 本 和 任何 相关 的 项 目 文档 的 基线 , 通过 逐步 迭 
代 基 线 之 间 相 互 构建 ， 直 到 完成 最 终 系 统 。 在 每 个 迭代 中 有 5 个 核心 工作 流 : 捕获 系统 应 该 做 
什么 的 需求 工作 流 ， 精 化 和 结构 化 需求 的 分 析 工 作 流 ， 在 系统 构架 内 实现 需求 的 设计 工作 流 ， 
构造 软件 的 实现 工作 流 ， 验 证 实现 是 否 如 期 望 那样 工作 的 测试 工作 流 。 随 着 UP 的 阶段 进展 ， 
每 个 核心 工作 流 的 工作 量 发 生 了 变化 。4 个 技术 阶段 由 主要 里 程 碑 所 终止 。 

。 ”初始 阶段 : 生命 周期 目标 。 

。 ” 精 化 阶段 ， 生命 周期 架构 。 

。 ”构建 阶段 :初始 运作 功能 。 

。 ”移交 阶段 ， 产品 发 布 。 

统一 过 程 的 典型 代表 是 RUP (Rational Unified Process)。RUP 是 UP 的 商业 扩展 ， 完 全 兼 
容 UP， 但 比 UP 更 完整 、 更 详细 。 


5.2.8 敏捷 方法 (Agile Development ) 
敏捷 开发 的 总 体 目 标 是 通过 “ 尽 可 能 早 地 、 持 续 地 对 有 价值 的 软件 的 交付 ”使 客户 满意 。 
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通过 在 软件 开发 过 程 中 加 入 灵活 性 ， 敏 捷 方 法 使 用 户 能 够 在 开发 周期 的 后 期 增加 或 改变 
敏捷 过 程 的 典型 方法 有 很 多 ， 每 一 种 方法 基于 一 套 原则 ， 这 些 原则 实现 了 敏捷 方法 所 宣称 
的 理念 《敏捷 宣言 )。 


1. 极限 编程 XP) 


XP 是 一 种 轻 量 级 (敏捷 )、 高 效 、 低 风险 、 柔 性 、 可 预测 的 、 科 学 的 软件 开发 方式 。 它 由 
价值 观 、 原 则 、 实 践 和 行为 4 个 部 分 组 成 ， 彼 此 相互 依赖 、 关 联 ， 并 通过 行为 贯穿 于 整个 生存 
周期 。 

。 4 大 价值 观 : 沟通 、 简 单 性 、 反 馈 和 勇气 。 

。 5 个 原则 : 快速 反馈 、 简 单 性 假设 、 逐 步 修改 、 提 倡 更 改 和 优质 工作 。 

。 12 个 最 佳 实践 : 计划 游戏 〈 快 速 制定 计划 、 随 着 细节 的 不 断 变化 而 完善 )、 小 型 发 布 

(系统 的 设计 要 能 够 尽 可 能 早 地 交付 )、 隐 喻 〈 找 到 合适 的 比喻 传达 信息 )、 简 单 设计 
(只 处 理 当 前 的 需求 , 使 设计 保持 简单 测试 先行 ( 先 写 测试 代码 , 然后 再 编写 程序 )、 
重 构 (重新 审视 需求 和 设计 ， 重 新 明确 地 描述 它们 以 符合 新 的 和 现 有 的 需求 )、 结 队 
编程 、 集 体 代码 所 有 制 、 持 续集 成 (可 以 按 日 甚至 按 小 时 为 客户 提供 可 运行 的 版 本 )、 
每 周 工作 40 个 小 时 、 现 场 客户 和 编码 标准 。 


2. 水 晶 法 〈Crystal) 

水 唱法 认为 每 一 个 不 同 的 项 目 都 需要 一 套 不 同 的 策略 、 约 定 和 方法 论 ， 认 为 人 对 软件 质量 
有 重要 的 影响 ， 因 此 随 着 项 目 质 量 和 开发 人 员 素质 的 提高 ， 项 目 和 过 程 的 质量 也 随 之 提高 。 通 
过 更 好 地 交流 和 经 常 性 的 交付 ， 软 件 生产 力 得 到 提高 。 

3. 并 列 争 求法 (Scrum) 

并 列 争 求法 使 用 迭代 的 方法 ， 其 中 ， 把 每 30 天 一 次 的 迭代 称 为 一 个 “冲刺 ” 并 按 需 求 的 
优先 级 别 来 实现 产品 。 多 个 自 组 织 和 自治 的 小 组 并 行 地 递增 实现 产品 。 协 调 是 通过 简短 的 日 常 
情况 会 议 来 进行 ， 就 像 橄 槛 球 中 的 “并 列 争 球 ” 

4. 自 适应 软件 开发 (ASD) 

ASD 有 6 个 基本 的 原则 : 有 一 个 使 命 作为 指导 ; 特征 被 视 为 客户 价值 的 关键 点 ; 过 程 中 的 
等 待 是 很 重要 的 ， 因 此 “ 重 做 ”与 “做 ”同样 关键 ; 变化 不 被 视 为 改正 ， 而 是 被 视 为 对 软件 开 
发 实际 情况 的 调整 确定 的 交付 时 间 迫 使 开发 人 员 认 真 考虑 每 一 个 生产 的 版 本 的 关键 需求 ， 风 
险 也 包含 其 中 。 
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5. 敏捷 统一 过 程 (AUP) 


敏捷 统一 过 程 (Agile Unified Process，AUP) 采用 “在 大 型 上 连续 ”以 及 在 “在 小 型 上 人 迭 
代 ” 的 原理 来 构建 软件 系统 。 采 用 经 典 的 UP 阶段 性 活动 (初始 、 精 化 、 构 建 和 转换 )， 提 供 了 
一 系列 活动 ， 能 够 使 团队 为 软件 项 目 构 想 出 一 个 全 面 的 过 程 流 。 在 每 个 活动 里 ， 一 个 团队 连 代 
使 用 敏捷 ， 并 将 有 意义 的 软件 增 量 尽 可 能 快 地 交付 给 最 终 用 户 。 每 个 AUP 夫 代 执行 以 下 活动 : 

。 ” 建 模 。 建 立 对 商业 和 问题 域 的 模型 表述 ， 这 些 模 型 “足够 好 ” 即 可 ， 以 便 团队 继续 

前 进 。 

。 ”实现 。 将 模型 翻译 成 源 代码 。 

。 ”测试 ,。 像 XP 一 样 , 团队 设计 和 执行 一 系列 的 测试 来 发 现 错误 以 保证 源 代码 满足 需求 。 

。 ”部 署 。 对 软件 增 量 的 交付 以 及 获取 最 终 用 户 的 反馈 。 

。 ”配置 及 项 目 管理 。 着 眼 于 变更 管理 、 风 险 管理 以 及 对 团队 的 任 一 制品 的 控制 。 项 目 管 

理 追 踪 和 控制 开发 团队 的 工作 进展 并 协调 团队 活动 。 
。 ”环境 管理 。 协 调 标 准 、 工 具 以 及 适用 于 开发 团队 的 支持 技术 等 过 程 基础 设施 。 


5.3 ”需求 分 析 


5.3.1 软件 需求 


在 进行 需求 获取 之 前 ， 首 先 要 明确 需要 获取 什么 ， 也 就 是 需求 包含 哪些 内 容 。 软 件 需求 是 
指 用 户 对 目标 软件 系统 在 功能 、 行 为 、 性 能 、 设 计 约 束 等 方面 的 期 望 。 通 常 ， 这 些 需求 包括 功 
能 需求 、 性 能 需求 、 用 户 或 人 的 因素 、 环 境 需 求 、 界 面 需求 、 文 档 需求 、 数 据 需 求 、 资 源 使 用 
需求 、 安 全 保密 需求 、 可 靠 性 需求 、 软 件 成 本 消耗 与 开发 进度 需求 等 ， 并 预先 估计 以 后 系统 可 
能 达到 的 目标 。 此 外 ， 还 需要 注意 其 他 非 功能 性 的 需求 。 具 体内 容 如 下 。 

(1) 功能 需求 。 考 虑 系统 要 做 什么 ， 在 何 时 做 ， 在 何 时 以 及 如 何 修改 或 升级 。 

(2) 性 能 需求 。 考 虑 软件 开发 的 技术 性 指标 。 例 如 ， 存 储 容量 限制 、 执 行 速度 、 响 应 时 间 
及 吞吐 量 。 

(3) 用 户 或 人 的 因素 。 考 虑 用 户 的 类 型 。 例 如 ， 各 种 用 户 对 使 用 计算 机 的 熟练 程度 ， 需 要 
接受 的 训练 ， 用 户 理解 、 使 用 系统 的 难度 ， 用 户 错误 操作 系统 的 可 能 性 等 。 

(4) 环境 需求 。 考 虑 未 来 软件 应 用 的 环境 ， 包 括 硬件 和 软件 。 对 硬件 设备 的 需求 包括 机 型 、 
外 设 、 接 口 、 地 点 、 分 布 、 湿 度 、 磁 场 干扰 等 ; 对 软件 的 需求 包括 操作 系统 、 网 络 、 数 据 库 等 。 

(5) 界面 需求 。 考 虑 来 自 其 他 系统 的 输入 ， 到 其 他 系统 的 输出 ， 对 数据 格式 的 特殊 规定 ， 
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对 数据 存储 介质 的 规定 。 


度 ， 


发 、 


(6) 文档 需求 。 考 虑 需要 哪些 文档 ， 文 档 针 对 哪些 读者 。 

(7) 数据 需求 。 考 虑 输入 、 输 出 数据 的 格式 ， 接 收 、 发 送 数据 的 频率 ， 数 据 的 准确 性 和 精 
数据 流量 ， 数 据 需 保持 的 时 间 。 

(8) 资源 使 用 需求 。 考 虑 软件 运行 时 所 需要 的 数据 、 其 他 软件 、 内 存 空间 等 资源 ， 软 件 开 
维护 所 需 的 人 力 、 支 撑 软件 、 开 发 设备 等 。 

(9) 安全 保密 要 求 。 考 虑 是 否 需 要 对 访问 系统 或 系统 信息 加 以 控制 , 隔离 用 户 数据 的 方法 ， 


用 户 程序 如 何 与 其 他 程序 和 操作 系统 隔离 以 及 系统 备份 要 求 等 。 


(10) 可 靠 性 要 求 。 考 虑 系统 的 可 靠 性 要 求 ， 系 统 是 否 必须 检测 和 隔离 错误 ， 出 错 后 ， 重 启 


系统 允许 的 时 间 等 。 


(11) 软件 成 本 消耗 与 开发 进度 需求 。 考 虑 开发 是 否 有 规定 的 时 间 表 ， 软 /硬件 投资 有 无 限 


制 等 。 


(12) 其 他 非 功 能 性 要 求 。 如 采用 某 种 开发 模式 ， 确 定 质量 控制 标准 、 里 程 碑 和 评审 、 验 收 


标准 、 各 种 质量 要 求 的 优先 级 等 ， 以 及 可 维护 性 方面 的 要 求 。 


这 些 需 求 可 以 来 自 于 用 户 (实际 的 和 潜在 的 )、 用 户 的 规约 、 应 用 领域 的 专家 、 相 关 的 技术 


标准 和 法 规 ， 也 可 以 来 自 于 原 有 的 系统 、 原 有 系统 的 用 户 、 新 系统 的 潜在 用 户 ， 甚 至 还 可 以 来 
自 于 竞争 对 手 的 产品 。 


5.3.2 需求 分 析 原 则 


需求 分 析 过 程 的 具体 实现 有 不 同 的 分 析 方 法 ， 这 些 方法 有 自己 独特 的 特点 。 然 而 ， 这 些 分 


析 方 法 都 遵循 一 组 操作 原则 。 


(1) 必须 能 够 表示 和 理解 问题 的 信息 域 。 

(2) 必须 能 够 定义 软件 将 完成 的 任务 。 

(3) 必须 能 够 表示 软件 的 行为 作为 外 部 事件 的 结束 )。 

(4) 必须 划分 描述 数据 、 功 能 和 行为 的 模型 ， 从 而 可 以 分 层次 地 揭示 细节 。 

(5) 分 析 过 程 应 该 从 要 素 信息 移 向 细节 信息 。 

通过 应 用 这 些 原 则 ， 分 析 人 员 将 能 系统 地 处 理 问题 。 检 查 信息 域 可 以 更 完整 地 理解 功能 ， 


证 


通过 模型 可 以 更 简洁 地 交流 功能 和 行为 的 特征 ， 应 用 抽象 与 分 解 可 减少 问题 的 复杂 度 。 
5.3.3 ”需求 工程 


需求 工程 是 一 个 不 断 反 复 的 需求 定义 、 文 档 记录 、 需 求 演进 的 过 程 ， 并 最 终 在 验证 的 基础 


上 冻结 需求 。 需 求 工程 可 以 细 分 为 需求 获取 、 需 求 分 析 与 协商 、 系 统 建 模 、 需 求 规约 、 需 求 验 
证 以 及 需求 管理 6 个 阶段 。 
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1. 需求 获取 


在 需求 获取 阶段 ， 系 统 分 析 人 员 通 过 与 用 户 的 交流 、 对 现 有 系统 的 观察 以 及 对 任务 进行 分 
析 确 定 系统 或 产品 范围 的 限制 性 描述 、 与 系统 或 产品 有 关 的 人 员 及 特征 列表 、 系 统 的 技术 环境 
的 描述 、 系 统 功能 的 列表 及 应 用 于 每 个 需求 的 领域 限制 、 一 组 描述 不 同 运行 条 件 下 系统 或 产品 
使 用 状况 的 应 用 场景 以 及 为 更 好 地 定义 需求 而 开发 的 原型 。 需 求 获 取 的 工作 产品 为 进行 需求 分 
析 提 供 了 基础 。 


2. 需求 分 析 与 协商 


需求 获取 结束 后 ， 分 析 活 动 对 需求 进行 分 类 组 织 ， 分 析 每 个 需求 与 其 他 需求 的 关系 ， 以 检 
查 需 求 的 一 致 性 、 重 登 和 遗漏 的 情况 ， 并 根据 用 户 的 需要 对 需求 进行 排序 。 在 需求 获取 阶段 ， 
经 常 出 现 以 下 问题 ， 用 户 提出 的 要 求 超出 软件 系统 可 以 实现 的 范围 或 实现 能 力 ;不 同 的 用 户 提 
出 了 相互 冲突 的 需求 ， 每 个 用 户 在 提出 自己 的 需求 时 都 会 说 “这 是 至 关 重 要 的 ” 所 以 系统 分 
析 人 员 需 要 通过 一 个 谈判 过 程 来 调解 这 些 冲 突 。 


3. 系统 建 模 


建 模 技 术 可 以 通过 合适 的 工具 和 符号 系统 地 描述 需求 。 建 模 工 具 的 使 用 在 用 户 和 系统 分 析 
人 员 之 间 建 立 了 统一 的 语言 和 理解 的 “桥梁 ”， 同 时 系统 分 析 人 员 借助 建 模 技术 对 获取 的 需求 
信息 进行 分 析 ， 排 除 错 误 和 弥补 不 足 ， 确 保 需求 文档 正确 地 反映 用 户 的 真实 意图 。 常 用 的 分 析 
和 建 模 方法 有 面向 数据 流 方法 、 面 向 数据 结构 方法 和 面向 对 象 方法 。 

在 观察 和 研究 某 一 事物 或 某 一 系统 时 ， 常 常 把 它 抽象 为 一 个 模型 。 创 建 模型 是 需求 分 析 阶 
段 的 重要 活动 。 模 型 以 一 种 简洁 、 准 确 、 结 构 清 晰 的 方式 系统 地 描述 了 软件 需求 ， 从 而 帮助 分 
析 员 理解 系统 的 信息 、 功 能 和 行为 ， 使 得 需求 分 析 任务 更 容易 实现 ， 结 果 更 系统 化 ， 同 时 易于 
发 现 用 户 描述 中 的 模糊 性 和 不 一 致 性 ， 模 型 将 成 为 软件 设计 的 基础 ， 为 设计 者 提供 软件 要 素 的 
表示 视图 ， 这 些 表示 可 被 转化 到 实现 的 语 境 中 去 ;更 重要 的 是 ， 模 型 还 可 以 在 分 析 人 员 和 用 户 
之 间 建 立 更 快捷 的 沟通 方式 ， 使 两 者 可 以 用 相同 的 工具 分 析 和 理解 问题 。 

在 软件 需求 分 析 阶 段 所 创建 的 模型 ， 要 着 重 于 描述 系统 要 做 什么 ， 而 不 是 如 何 去 做 ， 目 标 
软件 的 模型 不 应 涉及 软件 的 实现 细节 。 通 常情 况 下 ， 分 析 人 员 使 用 图 形 符号 来 创建 模型 ， 将 信 
息 、 处 理 、 系 统 行为 和 其 他 相关 特征 描述 为 各 种 可 识别 的 符号 ， 同 时 与 符号 图 形 相配 套 ， 并 辅 
以 文字 描述 ， 可 使 用 自然 语言 或 某 种 特殊 的 专门 用 于 描述 需求 的 语言 来 提供 辅助 的 信息 描述 。 

目前 ， 已 存在 的 多 种 需求 分 析 方 法 引用 了 不 同 的 分 析 策略 ， 常 用 的 分 析 方法 有 以 下 两 种 : 

(1) 面向 数据 流 的 结构 化 分 析 方法 (SA)。 

(2) 面向 对 象 的 分 析 方 法 (OOA)。 
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4. 需求 规约 


软件 需求 规约 是 分 析 任 务 的 最 终 产 物 , 通过 建立 完整 的 信息 描述 、 详 细 的 功能 和 行为 描述 、 
性 能 需求 和 设计 约束 的 说 明 、 合 适 的 验收 标准 ， 给 出 对 目标 软件 的 各 种 需求 。 需 求 规约 作为 用 
户 和 开发 者 之 间 的 一 个 协议 ， 在 之 后 的 软件 工程 各 阶段 发 挥 重 要 的 作用 。 软 件 需 求 规约 中 通常 
包含 以 下 内 容 。 

(1) 引言 。 引 言 陈述 软件 目标 ， 在 基于 计算 机 的 系统 语 境内 进行 描述 。 

(2) 信息 描述 。 信 息 描述 给 出 软件 必须 解决 的 问题 的 详细 描述 ， 记 录 信 息 内 容 、 信 息 流 
和 信息 结构 。 

(3) 功能 描述 。 功 能 描述 用 来 描述 解决 问题 所 需要 的 每 个 功能 。 其 中 包括 为 每 个 功能 说 
明 一 个 处 理 过程 ， 叙 述 设计 约束 ;叙述 性 能 特征 ; 用 一 个 或 多 个 图 形 形 象 地 表示 软件 的 整体 结 
构 和 软件 功能 与 其 他 系统 元 素 间 的 相互 影响 。 

(4) 行为 描述 。 行 为 描述 用 于 描述 作为 外 部 事件 和 内 部 产生 的 控制 特征 的 软件 操作 。 

(5) 检验 标准 。 检 验 标准 描述 检验 系统 成 功 的 标志 ， 即 对 系统 进行 什么 样 的 测试 ， 得 到 
什么 样 的 结果 ， 就 表示 系统 已 经 成 功 实现 了 。 检 验 标准 是 “确认 测试 ”的 基础 。 

(6) 参考 书目 。 参 考 书目 包含 了 对 所 有 和 该 软件 相关 的 文档 的 引用 ， 其 中 包括 其 他 的 软 
件 工程 文档 、 技 术 参 考 文献 、 厂 商 文 献 和 标准 。 

(7) 附录 。 附 录 包 含 了 规约 的 补充 信息 ， 表 格 数据 、 算 法 的 详细 描述 、 图 表 和 其 他 资料 。 


S. 需求 验证 


需求 验证 作为 需求 开发 阶段 工作 的 复查 手段 ， 其 目的 是 要 检验 需求 功能 的 正确 性 、 完 整 性 
和 清晰 性 ， 是 否 能 够 反映 用 户 的 意愿 ， 由 于 需求 的 变化 往往 使 系统 的 设计 和 实现 也 跟着 改变 ， 
所 以 由 需求 问题 引起 系统 变更 的 成 本 比 修改 设计 或 代码 错误 的 成 本 高 得 多 。 因 此 ， 为 保证 软件 
需求 定义 的 质量 ， 评 审 应 指定 专门 的 人 员 负 责 ， 并 按 规程 严格 进行 。 

需求 验证 需要 对 需求 文档 中 定义 的 需求 执行 多 种 检查 。 开 发 团队 要 对 用 户 需 求 进行 “ 遍 访 ”， 
逐条 解释 需求 含义 ;评审 团队 应 该 检查 需求 的 有 效 性 、 一 致 性 和 作为 一 个 整体 的 完备 性 。 评 审 
人 员 评审 时 往往 需要 检查 以 下 内 容 : 

(1) 系统 定义 的 目标 是 否 与 用 户 的 要 求 一 致 。 

(2) 系统 需求 分 析 阶 段 提供 的 文档 资料 是 否 齐全 ; 文档 中 的 描述 是 否 完整 、 清 晰 、 准 确 地 
反映 了 用 户 要 求 。 

(3) 被 开发 项 目的 数据 流 与 数据 结构 是 否 确 定 且 充 足 。 

(4) 主要 功能 是 否 已 包括 在 规定 的 软件 范围 之 内 ， 是 否 都 已 充分 说 明 。 
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(5) 设计 的 约束 条 件 或 限制 条 件 是 否 符合 实际 。 

(6) 开发 的 技术 风险 是 什么 。 

(7) 是 否 详细 地 制定 了 检验 标准 ， 它 们 能 否 对 系统 定义 进行 确认 。 

为 了 保证 软件 需求 定义 的 质量 ， 验 证 应 该 由 专门 的 人 员 来 负责 ， 按 照 规 定 严格 进行 。 除 分 
析 人 员 之 外 ， 还 要 有 用 户 ， 开 发 部 门 的 管理 者 ， 软 件 设计 、 实 现 、 测 试 的 人 员 参 加 。 评 审结 束 
应 有 负责 人 的 结论 意见 和 签字 。 

想 要 判断 一 组 需求 是 否 符合 用 户 的 需要 是 很 困难 的 。 用 户 需 要 描述 出 系统 的 操作 过 程 ， 构 
想 出 如 何 让 系统 加 入 到 他 们 的 工作 中 去 ， 这 种 抽象 对 于 一 个 普通 用 户 来 说 比较 困难 。 所 以 ， 需 
求 验证 也 不 可 能 发 现 所 有 的 需求 问题 。 在 需求 验证 之 后 ， 对 遗漏 的 补充 以 及 对 错误 理解 的 更 正 
是 不 可 避免 的 ， 因 此 需要 进行 需求 管理 。 


6. 需求 管理 


在 实际 的 开发 过 程 中 ， 获 取 、 分 析 、 建 模 、 编 写 规约 和 验证 这 些 需求 开发 活动 通常 是 交叉 、 
递增 和 反复 地 进行 。 而 且 ， 软 件 系统 的 需求 会 变更 ， 这 些 变更 不 仅 会 存在 于 项 目 开发 过 程 ， 而 
且 会 出 现在 项 目 已 经 付 诸 应 用 之 后 。 软 件 需求 管理 是 一 组 用 于 帮助 项 目 组 在 项 目 进展 中 的 任何 
时 候 去 标识 、 控 制 和 跟踪 需求 的 活动 ， 对 需求 工程 所 有 相关 活动 的 规划 和 控制 。 换 句 话 说， 需 
求 管 理 就 是 一 种 获取 、 组 织 并 记录 系统 需求 的 系统 化 方案 ， 以 及 一 个 使 用 户 与 项 目 团队 对 不 断 
变更 的 系统 需求 达成 并 保持 一 致 的 过 程 。 

在 需求 管理 中 ， 每 个 需求 被 赋予 唯一 的 标识 符 ， 一 旦 标识 出 需求 ， 就 可 以 为 需求 建立 跟踪 
表 , 每 个 跟踪 表 标 识 需 求 与 其 他 需求 或 设计 文档 、 代码、 测试 用 例 的 不 同 版 本 间 的 关系 。 例 如 ， 
特征 跟踪 表 ， 记 录 需 求 如 何 与 产品 或 系统 特征 相关 联 ， 来 源 跟踪 表 ， 记 录 每 个 需求 的 来 源 ， 依 
赖 跟踪 表 ， 描 述 需 求 间 如 何 关 联 等 。 

这 些 跟踪 表 可 以 用 于 需求 跟踪 。 在 整个 开发 过 程 中 ， 进 行 需求 跟踪 的 目的 是 为 了 建立 和 维 
护 从 用 户 需 求 开始 到 测试 之 间 的 一 致 性 与 完整 性 ， 确 保 所 有 的 实现 是 以 用 户 需 求 为 基础 ， 所 有 
的 输出 符合 用 户 需 求 ， 并且 全 面 覆 盖 了 用 户 需求 。 需 求 跟踪 有 两 种 方式 : 正 向 跟踪 和 逆向 跟踪 。 
其 中 ， 正 向 跟踪 以 用 户 需 求 为 切入 点 ， 检 查 《 需 求 规约 》 中 的 每 个 需求 是 否 都 能 在 后 继 工 作 产 
品 中 找到 对 应 点 ; 逆向 跟踪 检查 设计 文档 、 代 码 、 测 试用 例 等 工作 产品 是 否 都 能 在 《需求 规约 》 
中 找到 出 处 。 


5.4 系统 设计 


在 系统 分 析 阶 段 ， 我 们 已 经 搞 清楚 了 软件 “做 什么 ”的 问题 ， 并 把 这 些 需 求 通过 规格 说 明 
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书 描述 了 出 来 ， 这 也 是 目标 系统 的 逻辑 模型 。 进 入 设计 阶段 ， 要 把 软件 “做 什么 ”的 逻辑 模型 
转换 成 “怎么 做 ”的 物理 模型 ， 即 着 手 实现 软件 系统 的 需求 。 

系统 设计 的 主要 目的 就 是 为 系统 制定 蓝图 , 在 各 种 技术 和 实施 方法 中 权衡 利 整 , 精心 设计 ， 
合理 地 使 用 各 种 资源 ， 最 终 勾 画 出 新 系统 的 详细 设计 方案 。 

系统 设计 的 主要 内 容 包 括 新 系统 总 体 结构 设计 、 代 码 设计 、 输 出 设计 、 输 入 设计 、 处 理 过 
程 设 计 、 数 据 存储 设计 、 用 户 界面 设计 和 安全 控制 设计 等 。 

目前 ， 已 存在 的 多 种 系统 设计 方法 ， 常 用 的 设计 方法 有 以 下 两 种 。 

(1) 面向 数据 流 的 结构 化 设计 方法 (SD)。 

(2) 面向 对 象 的 分 析 方法 (OOD )。 

系统 设计 的 基本 任务 大 体 上 可 以 分 为 概要 设计 和 详细 设计 两 个 步骤 。 
5.4.1 概要 设计 


1) 设计 软件 系统 总 体 结构 

其 基本 任务 是 采用 某 种 设计 方法 ,将 一 个 复杂 的 系统 按 功 能 划分 成 模块 :确定 每 个 模块 的 
功能 ;确定 模块 之 间 的 调用 关系 ;确定 模块 之 间 的 接口 ， 即 模块 之 间 传 递 的 信息 ; 评价 模块 结 
构 的 质量 。 

软件 系统 总 体 结构 的 设计 是 概要 设计 关键 的 一 步 ， 直 接 影响 到 下 一 个 阶段 详细 设计 与 编码 
的 工作 。 软 件 系统 的 质量 及 一 些 整体 特性 都 在 软件 系统 总 体 结构 的 设计 中 决定 。 

2) 数据 结构 及 数据 库 设计 

(1) 数据 结构 的 设计 。 逐 步 细 化 的 方法 也 适用 于 数据 结构 的 设计 。 在 需求 分 析 阶 段 ， 已 经 
通过 数据 字典 对 数据 的 组 成 、 操 作 约束 和 数据 之 间 的 关系 等 方面 进行 了 描述 ， 确 定 了 数据 的 结 
构 特性 , 在 概要 设计 阶段 要 加 以 细 化 ,详细 设计 阶段 则 规定 具体 的 实现 细节 。 在 概要 设计 阶段 ， 
宣 使 用 抽象 的 数据 类 型 。 

(2) 数据 库 的 设计 。 数 据 库 的 设计 是 指数 据 存储 文件 的 设计 ， 主 要 进行 以 下 几 方 面 设计 。 

Q 概念 设计 。 在 数据 分 析 的 基础 上 ， 采 用 自 底 向 上 的 方法 从 用 户 角度 进行 视图 设计 ， 一 
般 用 E-R 模型 来 表述 数据 模型 。E-R 模型 既是 设计 数据 库 的 基础 ， 也 是 设计 数据 结构 的 基础 。 

@ 逻辑 设计 。E-R 模型 是 独立 于 数据 库 管 理 系统 (DBMS) 的， 要 结合 具体 的 DBMS 特 
征 来 建立 数据 库 的 逻辑 结构 。 

@ 物理 设计 。 对 于 不 同 的 DBMS， 物 理 环境 不 同 ， 提 供 的 存储 结构 与 存 取 方 法 各 不 相同 。 
物理 设计 就 是 设计 数据 模式 的 一 些 物理 细节 ， 如 数据 项 存储 要 求 、 存 取 方 法 和 索引 的 建立 等 。 

本 节 对 数据 库 技术 不 做 详细 讨论 ， 详 细 内 容 参 见 本 书 第 7 章 。 

3) 编写 概要 设计 文档 

文档 主要 有 概要 设计 说 明 书 、 数 据 库 设 计 说 明 书 、 用 户 手册 以 及 修订 测试 计划 。 
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4) 评审 
对 设计 部 分 是 否 完整 地 实现 了 需求 中 规定 的 功能 、 性 能 等 要 求 ， 设 计 方 法 的 可 行 性 ， 关 键 
的 处 理 及 内 外 部 接口 定义 的 正确 性 、 有 效 性 、 各 部 分 之 间 的 一 致 性 等 都 一 一 进行 评审 。 


5.4.2 详细 设计 


(1) 对 每 个 模块 进行 详细 的 算法 设计 ， 用 某 种 图 形 、 表 格 和 语言 等 工具 将 每 个 模块 处 理 过 
程 的 详细 算法 描述 出 来 。 

(2) 对 模块 内 的 数据 结构 进行 设计 。 

(3) 对 数据 库 进 行 物理 设计 ， 即 确定 数据 库 的 物理 结构 。 

(4) 其 他 设计 。 根 据 软件 系统 的 类 型 ， 还 可 能 要 进行 以 下 设计 。 

@ 代码 设计 。 为 了 提高 数据 的 输入 、 分 类 、 存 储 和 检索 等 操作 ， 节 约 内 存 空间 ， 对 数据 
库 中 某 些 数 据 项 的 值 要 进行 代码 设计 。 

@ 输入 /输出 格式 设计 。 

@ 用 户 界面 设计 。 

(5) 编写 详细 设计 说 明 书 。 

(6) 评审 。 对 处 理 过 程 的 算法 和 数据 库 的 物理 结构 都 要 评审 。 

系统 设计 的 结果 是 一 系列 的 系统 设计 文件 ， 这 些 文件 是 物理 实现 一 个 信息 系统 (包括 硬件 
设备 和 编制 软件 程序 ) 的 重要 基础 。 


5.5 系统 测试 
5.5.1 系统 测试 与 调试 


1. 系统 测试 的 意义 、 目 的 及 原则 


系统 测试 是 为 了 发 现 错误 而 执行 程序 的 过 程 ， 成 功 的 测试 是 发 现 了 至 今 尚 未 发 现 的 错误 的 
测试 。 

测试 的 目的 就 是 希望 能 以 最 少 的 人 力 和 时 间 发 现 潜在 的 各 种 错误 和 缺陷 。 用 户 应 根据 开发 
各 阶段 的 需求 、 设 计 等 文档 或 程序 的 内 部 结构 精心 设计 测试 实例 , 并 利用 这 些 实例 来 运行 程序 ， 
以 便 发 现 错误 的 过 程 。 

信息 系统 测试 应 包括 软件 测试 、 硬 件 测试 和 网 络 测试 。 硬 件 测试 、 网 络 测试 可 以 根据 具体 
的 性 能 指标 进行 ， 此 处 所 说 的 测试 更 多 的 是 指 软件 测试 。 
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系统 测试 是 保证 系统 质量 和 可 靠 性 的 关键 步骤 ， 是 对 系统 开发 过 程 中 的 系统 分 析 、 系 统 设 
计 和 实施 的 最 后 复查 。 根 据 测试 的 概念 和 目的 ， 在 进行 信息 系统 测试 时 应 遵循 以 下 基本 原则 。 

(1) 应 尽早 并 不 断 地 进行 测试 。 测 试 不 是 在 应 用 系统 开发 完 之 后 才 进 行 的 。 由 于 原始 问题 
的 复杂 性 、 开 发 各 阶段 的 多 样 性 以 及 参加 和 人员 之 间 的 协调 等 因素 ， 使 得 在 开发 的 各 个 阶段 都 有 
可 能 出 现 错误 。 因 此 ， 测 试 应 贯穿 在 开发 的 各 个 阶段 ， 应 尽早 纠正 错误 ， 消 除 隐患 。 

(2) 测试 工作 应 该 避免 由 原 开发 软件 的 人 或 小 组 承担 ， 一 方面 ， 开 发 人 员 往 往 不 愿 否 认 自 
己 的 工作 , 总 认为 自己 开发 的 软件 没有 错误 ; 另 一 方面 , 开发 人 员 的 错误 很 难 由 本 人 测试 出 来 ， 
很 容易 根据 自己 编程 的 思路 来 制定 测试 思路 ， 具 有 局 限 性 。 测 试 工作 应 由 专门 人 员 来 进行 ， 这 
样 会 更 客观 、 更 有 效 。 

(3) 在 设计 测试 方案 时 ， 不 仅 要 确定 输入 数据 ， 而 且 要 根据 系统 功能 确定 预期 输出 结果 。 
将 实际 输出 结果 与 预期 结果 相 比 较 就 能 发 现 测试 对 象 是 否 正确 。 

(4) 在 设计 测试 用 例 时 ， 不 仅 要 设计 有 效 、 合 理 的 输入 条 件 ， 也 要 包含 不 合理 、 失 效 的 输 
入 条 件 。 在 测试 的 时 候 ， 人 们 往往 习惯 按照 合理 的 、 正 常 的 情况 进行 测试 ， 而 忽略 了 对 异常 、 
不 合理 、 意 想不到 的 情况 进行 测试 ， 而 这 可 能 就 是 隐患 。 

(5) 在 测试 程序 时 ， 不 仅 要 检验 程序 是 否 做 了 该 做 的 事 ， 还 要 检验 程序 是 否 做 了 不 该 做 的 
事 。 多 余 的 工作 会 带 来 副作用 ， 影 响 程 序 的 效率 ， 有 时 会 带 来 潜在 的 危害 或 错误 。 

(6) 严格 按照 测试 计划 来 进行 ,避免 测试 的 随意 性 。 测试 计划 应 包括 测试 内 容 、 进 度 安排 、 
人 员 安 排 、 测 试 环境 、 测 试 工具 和 测试 资料 等 。 严 格 地 按照 测试 计划 可 以 保证 进度 ， 使 各 方面 
都 得 以 协调 进行 。 

(7) 妥善 保存 测试 计划 、 测 试用 例 ， 作 为 软件 文档 的 组 成 部 分 ， 为 维护 提供 方便 。 

(8) 测试 例子 都 是 精心 设计 出 来 的 ， 可 以 为 重新 测试 或 追加 测试 提供 方便 。 当 纠正 错误 、 
系统 功能 扩充 后 ,都 需要 重新 开始 测试 , 而 这 些 工作 的 重复 性 很 高 , 可 以 利用 以 前 的 测试 用 例 ， 
或 在 其 基础 上 修改 ， 然 后 进行 测试 。 


2. 测试 过 程 


测试 是 开发 过 程 中 的 一 个 独立 且 非 常 重要 的 阶段 。 测 试 过 程 基本 上 与 开发 过 程 平行 进行 。 

一 个 规范 化 的 测试 过 程 通常 包括 以 下 基本 的 测试 活动 。 

(1) 制订 测试 计划 。 在 制订 测试 计划 时 ， 要 充分 考虑 整个 项 目的 开发 时 间 和 开发 进度 以 及 
一 些 人 为 因素 和 客观 条 件 等 ， 使 得 测试 计划 是 可 行 的。 测试 计划 的 内 容 主 要 有 测试 的 内 容 、 进 
度 安 排 、 测 试 所 需 的 环境 和 条 件 、 测 试 培训 安排 等 。 

(2) 编制 测试 大 纲 。 测 试 大 纲 是 测试 的 依据 ， 它 明确 、 详 尽 地 规定 了 在 测试 中 针对 系统 的 
每 一 项 功能 或 特性 所 必须 完成 的 基本 测试 项 目 和 测试 完成 的 标准 。 
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(3) 根据 测试 大 纲 设计 和 生成 测试 用 例 , 产生 测试 设计 说 明文 档 。 其 内 容 主要 有 被 测 项 目 、 
输入 数据 、 测 试 过 程 和 预期 输出 结果 等 。 

(4) 实施 测试 。 测 试 的 实施 阶段 是 由 一 系列 的 测试 周期 组 成 的 。 在 每 个 测试 周期 中 ， 测 试 
人 员 和 开发 人 员 将 依据 预先 编制 好 的 测试 大 岗 和 准备 好 的 测试 用 例 对 被 测 软件 或 设备 进行 完 
整 的 测试 。 

(5) 生成 测试 报告 。 测 试 完成 后 要 形成 相应 的 测试 报告 ， 主 要 对 测试 进行 概要 说 明 ， 列 出 
测试 的 结论 ， 指 出 缺陷 和 错误 。 另 外 ， 给 出 一 些 建议 ， 如 可 采用 的 修改 方法 ， 各 项 修改 预计 的 
工作 量 及 修改 的 负责 人 员 。 


5.5.2 ”传统 钦 件 的 测试 策略 


软件 测试 策略 将 软件 测试 用 例 的 设计 方法 集成 到 一 系列 经 过 周密 计划 的 步骤 中 ， 从 而 使 软 
件 构造 成 功 地 完成 。 测 试 策略 提供 以 下 方面 的 路 径 图 : 描述 将 要 进行 的 测试 步骤 ， 这 些 步 骤 计 
划 和 执行 的 时 机 ， 需 要 多 少 工作 量 、 时 间 和 资源 。 因 此 ， 任 何 测试 策略 都 必须 包含 测试 计划 、 
测试 用 例 设计 、 测 试 执行 以 及 结果 数据 的 收集 和 评估 。 

软件 测试 策略 应 该 具有 足够 的 灵活 性 ,以便 促进 测试 方法 的 制定 。 同时 , 它 必须 足够 严格 ， 
以 便 在 项 目 进行 过 程 中 对 项 目 进行 合理 地 策划 和 追踪 管理 。 

有 效 的 软件 测试 实际 上 分 为 4 步 进行 ， 即 单元 测试 、 集 成 测试 、 确 认 测 试 和 系统 测试 。 

1. 单元 测试 


单元 测试 也 称 为 模块 测试 ， 在 模块 编写 完成 且 无 编译 错误 后 就 可 以 进行 。 单 元 测试 侧重 于 
模块 中 的 内 部 处 理 逻 辑 和 数据 结构 。 如 果 选 用 机 器 测试 ， 一 般 用 白 盒 测 试 法 。 这 类 测试 可 以 对 
多 个 模块 同时 进行 。 

1) 单元 测试 的 测试 内 容 

单元 测试 主要 检查 模块 的 以 下 5 个 特征 。 

(1) 模块 接口 。 模 块 的 接口 保证 了 测试 模块 的 数据 流 可 以 正确 地 流入 、 流 出 。 在 测试 中 应 
检查 以 下 要 点 : 

Q 测试 模块 的 输入 参数 和 形式 参数 在 个 数 、 属 性 、 单 位 上 是 否 一 致 。 

@ 调用 其 他 模块 时 ， 所 给 出 的 实际 参数 和 被 调用 模块 的 形式 参数 在 个 数 、 属 性 、 单 位 上 
是 否 一 致 。 

@ 调用 标准 函数 时 ， 所 用 的 参数 在 属性 、 数 目 和 顺序 上 是 否 正确 。 
@ 全 局 变量 在 各 模块 中 的 定义 和 用 法 是 否 一 致 。 


第 5 章 软件 工程 基础 知识 


@@ 输入 是 否 仅 改变 了 形式 参数 。 

开 / 关 的 语句 是 否 正 确 。 

@ 规定 的 VO 格式 是 否 与 输入 /输出 语句 一 致 。 

在 使 用 文件 之 前 是 否 已 经 打开 文件 或 使 用 文件 之 后 是 否 已 经 关闭 文件 。 

(2) 局 部 数据 结构 。 在 单元 测试 中 ， 局 部 数据 结构 出 错 是 比较 常见 的 错误 ， 在 测试 时 应 重 

中 变量 的 说 明 是 否 合适 。 

@ 是 否 使 用 了 尚未 赋值 或 尚未 初始 化 的 变量 。 

@ 变量 的 初始 值 或 默认 值 是 否 正 确 。 

@ 变量 名 是 否 有 错 ( 例 如 拼写 错 )。 

(3) 重要 的 执行 路 径 。 在 单元 测试 中 ， 对 路 径 的 测试 是 最 基本 的 任务 。 由 于 不 能 进行 穷 举 
测试 ， 需 要 精心 设计 测试 例子 来 发 现 是 否 有 计算 、 比 较 或 控制 流 等 方面 的 错误 。 

@ 计算 方面 的 错误 。 算 术 运 算 的 优先 次 序 不 正确 或 理解 错误 ， 精 度 不 够 ， 运 算 对 象 的 类 
型 彼此 不 相 容 ;算法 错 ; 表达 式 的 符号 表示 不 正确 等 。 

@ 比较 和 控制 流 的 错误 。 本 应 相等 的 量 由 于 精度 造成 不 相等 ， 不 同类 型 进行 比较 ， 逻 辑 
运算 符 不 正确 或 优先 次 序 错误 ， 循 环 终止 不 正确 (如 多 循环 一 次 或 少 循环 一 次 )、 死 循环 :不 
恰当 地 修改 循环 变量 ， 当 遇 到 分 支 循 环 时 出 口 错误 等 。 

(4) 出 错 处 理 。 好 的 设计 应 该 能 预测 到 出 错 的 条 件 并 且 有 对 出 错 处 理 的 路 径 。 虽 然 计算 机 
可 以 显示 出 错 信息 的 内 容 ， 但 仍 需要 程序 员 对 出 错 进行 处 理 ， 保 证 其 逻辑 的 正确 性 ， 以 便于 用 
户 维护 。 

(5) 边界 条 件 。 边 界 条 件 的 测试 是 单元 测试 的 最 后 工作 ， 也 是 非常 重要 的 工作 。 软 件 容易 
在 边界 出 现 错误 。 

2) 单元 测试 过 程 

由 于 模块 不 是 独立 运行 的 程序 ， 各 模块 之 间 存 在 调用 与 被 调用 的 关系 。 在 对 每 个 模块 进行 
测试 时 ， 需 要 开发 两 种 模块 。 单 元 测试 环境 如 图 5-9 所 示 。 

。 ”驱动 模块 。 相 当 于 一 个 主 程序 ， 接 收 测试 例子 的 数据 ， 将 这 些 数据 送 到 测试 模块 ， 输 

出 测试 结果 。 

。 ” 桩 模块 (也 称 为 存根 模块 )。 桩 模块 用 来 代替 测试 模块 中 所 调用 的 子 模块 ， 其 内 部 可 

进行 少量 的 数据 处 理 ， 目 的 是 为 了 检验 入 口 ， 输 出 调用 和 返回 的 信息 。 

提高 模块 的 内 聚 度 可 以 简化 单元 测试 。 如 果 每 个 模块 只 完成 一 种 功能 , 对 于 具体 模块 来 讲 ， 
所 需 的 测试 方案 数据 会 显著 减少 ， 而 且 更 容易 发 现 和 预测 模块 中 的 错误 。 
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接口 
局 部 数据 结构 
边界 条 件 
独立 路 径 
错误 处 理 路 径 


结果 


图 5-9 单元 测试 环境 


2. 集成 测试 


集成 测试 就 是 把 模块 按 系 统 设计 说 明 书 的 要 求 组 合 起 来 进行 测试 。 即 使 所 有 的 模块 都 通过 
了 测试 ， 在 集成 之 后 ， 仍 然 可 能 出 现 问题 : 穿 过 模块 的 数据 丢失 ;一 个 模块 的 功能 对 其 他 模块 
造成 有 害 的 影响 ， 各 个 模块 集成 起 来 没有 达到 预期 的 功能 ;全 局 数据 结构 出 现 问题 。 另 外 ， 单 
个 模块 的 误差 可 以 接受 ， 但 模块 组 合 后 ， 可 能 会 出 现 误差 累积 ， 最 后 累积 到 不 能 接受 的 程度 。 
集成 测试 是 构造 软件 体系 结构 的 系统 化 技术 ， 同 时 也 是 进行 一 些 旨 在 发 现 与 接口 相关 的 错误 的 
测试 ， 其 目标 是 利用 已 通过 单元 测试 的 构件 建立 设计 中 描述 的 程序 结构 。 

通常 ， 集 成 测试 有 两 种 方法 : 一 种 是 非 增 量 集成 ， 分 别 测试 各 个 模块 ， 再 把 这 些 模块 组 合 
起 来 进行 整体 测试 ， 另 一 种 是 增 量 集成 ， 即 以 小 增 量 的 方式 逐步 进行 构造 和 测试 。 非 增 量 式 集 
成 可 以 对 模块 进行 并 行 测试 ， 能 充分 利用 人 力 ， 并 加 快 工程 进度 。 但 这 种 方法 容易 混乱 ， 出 现 
错误 不 容易 查找 和 定位 。 增 量 式 测试 的 范围 一 步 步 扩 大 ， 错 误 容 易 定 位 ， 更 易于 对 接口 进行 彻 
底 测 试 ， 并 且 可 以 运用 系统 化 的 测试 方法 。 下 面 讨论 一 些 增 量 集成 策略 。 

1) 自 顶 向 下 集成 测试 

自 项 向 下 集成 测试 是 一 种 构造 软件 体系 结构 的 增 量 方法 。 模 块 的 集成 顺序 为 从 主 控 模 块 
( 主 程序 ) 开始 ， 沿 着 控制 层次 逐步 向 下 ， 以 深度 优先 或 广度 优先 的 方式 将 从 属于 或 间接 从 
属于 ) 主 控 模 块 的 模块 集成 到 结构 中 。 

如 图 5-10 所 示 , 深度 优先 集成 是 首先 集成 位 于 程序 结构 中 主 控 路 径 上 的 所 有 构件 , 也 可 以 
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根据 特定 应 用 系统 的 特征 进行 选择 。 


图 5-10 自 项 向 下 集成 


例如 ， 选 择 最 左边 的 路 径 ， 首 先 集成 构件 M1、Ms 和 Ms; 其次， 集成 Ms 或 Me ( 若 ? 的 
正常 运行 是 必需 的 )， 然 后 集成 中 间 和 右边 控制 路 径 上 的 构件 。 广 度 优先 集成 首先 沿 着 水 平方 
向 ， 将 属于 同一 层 的 构件 集成 起 来 。 例 如 图 5-10 中 ， 首 先 将 构件 MM、Ms 和 M4 集成 起 来 :其 
次 是 控制 成 MX6、Mi、M， 依 此 类 推 。 集 成 过 程 可 以 通过 下 列 5 个 步骤 完成 。 

(1) 主 控 模块 用 作 测 试 驱动 模块 ， 用 这 些 从 属于 主 控 模 块 的 所 有 模块 代替 桩 模块 。 

(2) 依靠 所 选择 的 集成 方法 〈 即 深度 优先 或 广度 优先 )， 每 次 用 实际 模块 替换 一 个 从 属 桩 
模块 。 

(3) 在 集成 每 个 模块 后 都 进行 测试 。 

(4) 在 完成 每 个 测试 集 之 后 ， 用 实际 模块 替换 另 一 个 桩 模块 。 

(5) 可 以 执行 回归 测试 ， 以 确保 没有 引入 新 的 错误 。 

回 到 第 〈2) 步 继续 执行 此 过 程 ， 直 到 完成 了 整个 程序 结构 的 构造 。 

2) 自 底 向 上 集成 测试 

自 底 向 上 集成 测试 就 是 从 原子 模块 〈 程 序 结构 的 最 底层 构件 ) 开始 进行 构造 和 测试 。 由 于 
构件 是 自 底 向 上 集成 的 ， 在 处 理 时 所 需要 的 从 属于 给 定 层次 的 模块 总 是 存在 的 ， 因 此 ， 没 有 必 
要 使 用 桩 模块 。 自 底 向 上 集成 策略 可 以 利用 以 下 步骤 来 实现 。 

(1) 连接 低层 构件 以 构成 完成 特定 子 功能 的 簇 。 

(2) 编写 驱动 模块 (测试 的 控制 程序 ) 以 协调 测试 用 例 的 输入 和 输出 。 

(3) 测试 簇 。 
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(4) 去 掉 驱 动 程序 ， 沿 着 程序 结构 向 上 逐步 连接 艇 。 

遵循 这 种 模式 的 集成 如 图 5-11 所 示 。 连 接 相 应 的 构件 形成 饼 1、 簇 2 和 簇 3， 利 用 驱动 模 
块 (图 中 的 虚线 框 》 对 每 个 禾 进 行 测试 。 簇 1 和 簇 2 中 的 构件 从 属于 模块 M,， 去 掉 驱 动 模块 
Di 和 D,， 将 这 两 个 簇 直接 与 M 相连。 与 之 相 类 似 ， 在 簇 3 与 Mo 连接 之 前 去 掉 驱 动 模块 D;， 
最 后 将 Ms 和 Mi 与 构件 MK 连接 在 一 起 。 
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图 5-11 自 底 向 上 集成 


随 着 集成 向 上 进行 ， 对 单独 的 测试 驱动 模块 的 需求 减少 。 事 实 上 ， 若 程序 结构 的 最 上 两 层 
是 自 项 向 下 集成 的 ， 驱 动 模块 的 数量 可 以 大 大 减少 ， 而 且 簇 的 集成 得 到 明显 简化 。 

3) 回归 测试 

每 当 加 入 一 个 新 模块 作为 集成 测试 的 一 部 分 时 ， 软 件 发 生变 更 ， 建 立 了 新 的 数据 流 路 径 ， 
可 能 出 现 新 的 IO, 以 及 调用 新 的 控制 逻辑 。 这 些 变 更 可 能 会 使 原来 可 以 正常 工作 的 功能 产生 问 
题 。 在 集成 测试 策略 的 环境 下 ， 回 归 测试 是 重新 执行 已 测试 过 的 某 些 子 集 ， 以 确保 变更 没有 传 
播 不 期 望 的 副作用 。 

回归 测试 有 助 于 保证 变更 不 引入 无 意识 行为 或 额外 的 错误 。 回 归 测 试 可 以 手工 进行 ， 方法 
是 重新 执行 所 有 测试 用 例 的 子 集 ， 或 者 利用 捕 提 /回放 工具 自动 执行 。 捕 提 / 回 放 工 具 使 软件 工 
程 师 能 够 为 后 续 的 回放 与 比较 捕 提 测试 用 例 和 测试 结果 。 回 归 测试 要 执行 的 测试 子 集 包含 以 下 
3 种 测试 用 例 。 
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。 ”能 够 测试 软件 所 有 功能 的 具有 代表 性 的 测试 样本 。 

。 ”额外 测试 ， 侧 重 于 可 能 会 受 变 更 影响 的 软件 功能 。 

。 ”侧重 于 已 发 生变 更 的 软件 构件 测试 。 

随 着 集成 测试 的 进行 ， 回 归 测试 的 数量 可 能 变 得 相当 庞大 ， 因 此 ， 应 将 回归 测试 用 例 设计 
成 只 包括 设计 每 个 主要 程序 功能 的 一 个 或 多 个 错误 类 的 测试 。 一 旦 发 生变 更 ， 对 每 个 软件 功能 
重新 执行 所 有 的 测试 是 不 切实 际 的 ， 而 且 效 率 很 低 。 

4) 冒 烟 测试 

当 开发 软件 产品 时 , 冒 烟 测试 是 一 种 常用 的 集成 测试 方法 , 是 时 间 关 键 项 目的 决定 性 机 制 ， 
它 让 软件 团队 频繁 地 对 项 目 进 行 评估 。 本 质 上 ， 冒 烟 测 试 方法 包括 下 列 活动 : 

(1) 将 已 经 转换 为 代码 的 软件 构件 集成 到 构建 中 。 一 个 构建 包括 所 有 的 数据 文件 、 库 、 可 
复 用 的 模块 以 及 实现 一 个 或 多 个 产品 功能 所 需 的 工程 化 构件 。 

(2) 设计 一 系列 测试 以 暴露 影响 构建 正确 的 完成 其 功能 的 错误 ， 其 目的 是 为 了 发 现 极 有 可 
能 造成 项 目 延迟 的 业务 阻塞 错误 。 

(3) 每 天 将 该 构建 与 其 他 构建 及 整个 软件 产品 (以 其 当前 形势 ) 集 成 起 来 进行 冒 烟 测试 。 
这 种 集成 方法 可 以 自 项 向 下 ， 也 可 以 自 底 向 上 。 


3. 确认 测试 


确认 测试 始 于 集成 测试 的 结束 ， 那 时 已 测试 完 单个 构件 ， 软 件 已 组 装 成 完整 的 软件 包 ， 且 
接口 错误 已 被 发 现 和 改正 。 在 进行 确认 测试 或 系统 级 测试 时 ， 传 统 软件 、 面 向 对 象 软件 及 
WebApp 之 间 的 差别 已 经 消失 ， 测 试 集中 于 用 户 可 见 的 动作 和 用 户 可 识别 的 系统 输出 。 

1) 确认 测试 准则 

软件 确认 是 通过 一 系列 表明 与 软件 需求 相符 合 的 测试 而 获得 的 。 测 试 计 划 列 出 将 要 执行 的 
测试 类 , 测试 规程 定义 了 特定 的 测试 用 例 , 设计 的 特定 测试 用 例 用 于 确保 满足 所 有 的 功能 需求 ， 
具有 所 有 的 行为 特征 ， 所 有 内 容 都 准确 无 误 且 正确 显示 ， 达 到 所 有 的 性 能 需求 ， 文 档 是 正确 可 
用 的 ， 且 满足 其 他 需求 (如 可 移植 性 、 兼 容 性 、 错 误 恢复 和 可 维护 性 )。 

执行 每 个 确认 测试 用 例 之 后 ， 存 在 下 面 两 种 可 能 条 件 之 一 : 中 功能 或 性 能 特征 符合 需求 规 
格 说 明 ， 可 以 接受 ; @ 发 现 了 与 规格 说 明 的 偏差 ， 创 建 缺陷 列表 。 在 项 目的 这 个 阶段 发 现 的 错 
误 或 偏差 很 难 在 预定 的 交付 期 之 前 得 到 改正 。 此 时 往往 必须 与 客户 进行 协商 ， 确 定 解决 缺陷 的 
方法 。 

2) 配置 评审 

确认 过 程 的 一 个 重要 成 分 是 配置 评审 ， 主 要 是 检查 软件 〈 源 程序 、 目 标 程序 )、 文 档 〈 包 
括 面向 开发 和 用 户 的 文档 ) 和 数据 (程序 内 部 的 数据 或 程序 外 部 的 数据 》 是 否 齐 全 以 及 分 类 是 
否 有 序 。 确 保 文档 、 资 料 的 正确 和 完善 ， 以 便 维护 阶段 使 用 。 
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3) a 测试 与 B 测试 

当 为 客户 开发 软件 时 ， 执 行 一 系列 验收 测试 能 使 客户 确认 所 有 的 需求 。 验 收 测试 是 由 最 终 
用 户 而 不 是 软件 工程 师 进行 的 ， 它 的 范围 从 非 正式 的 “测试 驱动 ”直到 有 计划 地 、 系 统 地 进行 
一 系列 测试 。 

若 将 软件 开发 为 产品 , 由 多 个 用 户 使 用 , 让 每 个 用 户 都 进行 正式 的 验收 测试 是 不 切实 际 的 。 
多 数 软件 开发 者 使 用 被 称 为 a 测试 与 B 测试 的 过 程 ， 以 期 查找 到 似乎 只 有 最 终 用 户 才能 发 现 的 
错误 。 

a 测试 是 由 有 代表 性 的 最 终 用 户 在 开发 者 的 场所 进行 。 软 件 在 自然 的 环境 下 使 用 ， 开 发 者 
站 在 用 户 的 后 面 观 看 ， 并 记录 错误 和 使 用 问题 。a 测试 在 受 控 的 环境 下 进行 。 

B 测试 在 一 个 或 多 个 最 终 用 户 场所 执行 。 与 a 测试 不 同 ， 开 发 者 通常 不 在 场 ， 因 此 ，B 测 
试 是 在 不 被 开发 者 控制 的 环境 下 软件 的 “现场 ”应 用 。 最 终 用 户 记录 测试 过 程 中 遇见 的 所 有 问 
题 〈 现 实 存在 的 或 想象 的 )， 并 定期 地 报告 给 开发 者 。 接 到 B 测试 的 问题 报告 之 后 ， 开 发 人 员 
对 软件 进行 修改 ， 然 后 准备 向 最 终 用 户 发 布 软件 产品 。 

B 测试 的 一 种 变 体 称 为 客户 验收 测试 ， 有 时 是 按照 合同 交付 给 客户 时 进行 的 。 客 户 执行 一 
系列 的 特定 测试 ， 试 图 在 从 开发 者 那里 接收 软件 之 前 发 现 错误 。 在 某 些 情 况 下 例如 ， 大 公司 
或 政府 系统 )， 验 收 测试 可 能 是 非常 正式 的 ， 可 能 会 测试 很 多 天 ， 甚 至 几 个 星期 。 


4. 系统 测试 


系统 测试 是 将 已 经 确认 的 软件 、 计 算 机 硬件 、 外 设 和 网 络 等 其 他 因素 结合 在 一 起 ， 进 行 信 
息 系统 的 各 种 集成 测试 和 确认 测试 ， 其 目的 是 通过 与 系统 的 需求 相 比较 ， 发 现 所 开发 的 系统 与 
用 户 需 求 不 符 或 矛盾 的 地 方 。 

1) 恢复 测试 

多 数 基于 计算 机 的 系统 必须 从 错误 中 恢复 并 在 一 定 的 时 间 内 重新 运行 。 在 有 些 情况 下 ， 系 
统 必须 是 容错 的 ， 也 就 是 说 ， 处 理 错误 绝 不 能 使 整个 系统 功能 都 停止 。 而 在 有 些 情 况 下 ， 系 统 
的 错误 必须 在 特定 的 时 间 内 或 严重 的 经 济 危害 发 生 之 前 得 到 改正 。 

恢复 测试 是 一 种 系统 测试 ， 通 过 各 种 方式 强制 地 让 系统 发 生 故 障 ， 并 验证 能 否 按照 要 求 从 
故障 中 恢复 过 来 ， 并 在 约定 的 时 间 内 开始 事务 处 理 ， 而 且 不 对 系统 造成 任何 伤害 。 如 果 系 统 的 


果 恢 复 需要 人 工 干预 ， 就 要 对 恢复 的 平均 时 间 进 行 评估 并 判断 它 是 否 在 允许 的 范围 内 。 
2) 安全 性 测试 
任何 管理 敏感 信息 或 能 够 对 个 人 造成 不 正当 伤害 (或 带 来 好 处 ) 的 计算 机 系统 都 是 非法 入 
侵 的 目标 。 安 全 性 测试 验证 建立 在 系统 内 的 保护 机 制 是 否 能 够 实际 保护 系统 不 受 非法 入 侵 。 
在 安全 性 测试 过 程 中 ,测试 人 员 模 拟 非法 入 侵 者 ， 采 用 各 种 方法 冲破 防线 。 系 统 安全 性 设 
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计 准 则 是 使 非法 入 侵 者 所 花费 的 代价 大 于 攻破 系统 之 后 获取 信息 的 价值 ， 此 时 非法 入 侵 已 无 利 
可 图 。 

3) 压力 测试 

压力 测试 要 求 以 非 正常 的 数量 、 频 率 或 容量 等 方式 执行 系统 。 例 如 : 在 平均 每 秒 出 现 1 一 2 
次 中 断 的 情况 下 ， 可 以 设计 每 秒 产生 10 次 中 断 的 测试 用 例 ， 将 输入 数据 的 量 提高 一 个 数量 级 
以 确定 输入 功能 将 如 何 反 应 ;执行 需要 最 大 内 存 或 其 他 资源 的 测试 用 例 ， 设 计 可 能 在 实际 的 运 
行 系统 中 产生 惨败 的 测试 用 例 ; 创建 可 能 会 过 多 查找 磁盘 驻 留 数据 的 测试 用 例 。 从 本 质 上 来 说 ， 
压力 测试 者 是 在 试图 破坏 程序 。 

压力 测试 的 一 个 变 体 称 为 敏感 性 测试 。 在 一 些 情况 下 (最 常见 的 是 在 数学 算法 中 )， 包 含 
在 有 效 数据 界限 之 内 的 一 小 部 分 数据 可 能 会 引起 极端 处 理 情况 ， 甚 至 是 错误 处 理 或 性 能 的 急剧 
下 降 。 敏 感性 测试 试图 在 有 效 输入 类 中 发 现 会 引发 系统 不 稳定 或 错误 处 理 的 数据 组 合 。 

4) 性 能 测试 

对 于 实时 和 嵌入 式 系统 ， 提 供 所 需 功 能 但 不 符合 性 能 需求 的 软件 是 不 能 接受 的 。 性 能 测试 
用 来 测试 软件 在 集成 环境 中 的 运行 性 能 。 在 测试 过 程 中 的 任何 步骤 都 可 以 进行 性 能 测试 。 即 使 
是 在 单元 级 ， 也 可 以 在 执行 测试 时 评估 单个 模块 的 性 能 。 然 而 ， 只 有 当 整 个 系统 的 所 有 成 分 完 
全 集成 指挥 时 才能 确定 系统 的 真实 性 能 。 

性 能 测试 经 常 与 压力 测试 一 起 进行 ， 且 常 需要 硬件 和 软件 工具 。 也 就 是 说 ， 以 严格 的 方式 
测量 资源 〈 例 如， 处 理 器 周期 ) 的 利用 往往 是 必要 的 。 当 有 运行 间歇 或 时 间 发 生 时 ， 外 部 工具 
可 以 监测 到 ， 并 可 定期 监测 采样 机 的 状态 。 通 过 检测 系统 ， 测 试 人 员 可 以 发 现 导致 效率 降低 或 
系统 故障 的 情形 。 

5) 部 署 测试 

在 很 多 情况 下 ， 软 件 必须 在 多 种 平台 及 操作 系统 环境 中 运行 。 有 时 也 将 部 署 测 试 称 为 配置 
测试 ， 是 在 软件 将 要 运行 的 每 一 种 环境 中 测试 软件 。 另 外 ， 部 署 测 试 检查 客户 将 要 使 用 的 所 有 
安装 程序 及 专业 安装 软件 ， 并 检查 用 于 向 最 终 用 户 介绍 软件 的 所 有 文档 。 


5.5.3 ”测试 面向 对 象 软件 

对 于 面向 对 象 软件 ， 测 试 的 基本 目标 仍然 是 在 现实 的 时 间 范 围 内 利用 可 控 的 工作 量 找 出 尽 
可 能 多 的 错误 ， 但 是 其 本 质 特 征 的 不 同 使 得 测试 策略 和 技术 也 发 生 了 变化 。 

1. 单元 测试 

面向 对 象 软件 中 单元 的 概念 发 生 了 变化 , 封装 导出 了 类 的 定义 。 每 个 类 和 类 的 实例 (对象 ) 


有 属性 〈 数 据 ) 和 处 理 这 些 数据 的 操作 函数 或 方法 )。 封 装 的 类 常 是 单元 测试 的 重点 ， 然 而 ， 
类 中 包含 的 操作 是 最 小 的 可 测试 单元 。 由 于 类 中 可 以 包含 一 些 不 同 的 操作 ， 且 特殊 的 操作 可 以 
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作为 不 同类 的 一 部 分 存在 ， 因 此 ， 面 向 对 象 软件 的 类 测试 是 由 封装 在 该 类 中 的 操作 和 类 的 状态 
行为 驱动 的 。 
2. 集成 测试 


由 于 面向 对 象 软件 没有 明显 的 层次 控制 结构 ， 因 此 面向 对 象 环境 中 的 集成 测试 有 两 种 
策略 : 

(1) 基于 线程 的 测试 ， 对 响应 系统 的 一 个 输入 或 事件 所 需 的 一 组 类 进行 集成 ， 每 个 线程 单 
独 地 集成 和 测试 ， 并 应 用 回归 测试 以 确保 没有 产生 副作用 。 

(2) 基于 使 用 的 测试 ， 通 过 测试 很 少 使 用 服务 类 的 那些 类 开始 系统 的 构建 。 


5.5.4 测试 Web 应 用 


由 于 WebApp 位 于 网 络 上 ， 并 与 很 多 不 同 的 操作 系统 、 浏 览 器 (位 于 很 多 不 同 的 设备 上 )、 
硬件 平台 、 通 信 协 议 及 “暗中 的 ”应 用 系统 进行 交互 作用 ， 错 误 的 查找 是 一 个 重大 的 挑战 。 
为 了 了 解 Web 工程 环境 中 的 测试 目标 ， 必 须 考 虑 WebApp 质量 的 多 种 维度 。 


1. 质量 维度 


良好 的 设计 应 该 将 质量 集成 到 Web 应 用 中 , 通过 对 设计 模型 中 的 不 同 元 素 进行 一 系列 技术 
评审 ， 对 质量 进行 评估 。 评 估 和 测试 都 要 检查 下 面 质量 维度 中 的 一 项 或 多 项 。 

(1) 内 容 。 在 语法 及 语义 层 对 内 容 进行 评估 。 在 语法 层 ， 对 于 文本 的 文档 进行 拼写 、 标 
点 及 文法 方面 的 评估 ; 在 语义 层 ， 所 表示 信息 的 正确 性 、 整 个 内 容 对 象 和 相关 对 象 的 一 致 性 及 
清晰 性 都 要 评估 。 

(2) 功能 。 对 功能 进行 测试 ， 以 发 现 与 客户 需求 不 一 致 的 错误 。 对 于 每 一 项 WebApp 的 
功能 ， 评 定 其 正确 性 、 不 稳定 性 及 与 相应 的 实现 标准 例如 ，Java 或 AJAX 语言 标准 ) 的 总 体 
符合 程度 。 

(3) 结构 。 对 结构 进行 评估 ， 以 保证 它 正确 地 表示 WebApp 的 内 容 及 功能 ， 是 可 扩展 的 ， 
并 支持 新 内 容 、 新 功能 的 增加 。 

(4) 可 用 性 。 对 可 用 性 进行 测试 ， 以 保证 接口 支持 各 种 类 型 的 用 户 ， 各 种 用 户 都 能 够 学 
会 及 使 用 所 有 需要 的 导航 语法 及 语义 。 

(5) 导航 性 。 对 导航 性 进行 测试 ， 以 保证 检查 所 有 的 导航 语法 及 语义 ， 发 现任 何 导航 错 
误 〈 例 如 ， 死 链接 、 不 合适 的 链接 、 错 误 链接 等 )。 

(6) 性 能 。 在 各 种 不 同 的 操作 条 件 、 配 置 及 负载 下 对 性 能 进行 测试 ， 以 保证 系统 响应 用 
户 的 交互 并 处 理 极端 的 负载 情况 ， 而 且 没 有 出 现 操作 上 不 可 接受 的 性 能 降低 。 

(7) 兼容 性 。 在 客户 端 及 服务 器 端 ， 在 各 种 不 同 的 主机 配置 下 通过 运行 WebApp 对 兼容 性 进 
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行 测试 ， 目 的 是 发 现 对 特定 主机 配置 的 错误 。 
(8) 安全 性 。 对 安全 性 进行 测试 ， 通 过 评定 可 能 存在 的 弱点 试图 对 每 个 弱点 进行 攻击 。 
任何 成 功 的 突破 尝试 都 被 认为 是 一 个 安全 漏洞 。 


2. WebApp 测试 策略 


WebApp 测试 策略 采用 所 有 软件 测试 使 用 的 基本 原理 ， 并 建议 使 用 面向 对 象 系统 使 用 的 策 
略 和 战术 。 下 面 的 步骤 对 此 方法 进行 了 总 结 。 

(1) 对 WebApp 的 内 容 模型 进行 评审 ， 以 发 现 错误 。 

(2) 对 接口 模型 进行 评审 ， 保 证 适合 所 有 的 用 例 。 

(3) 评审 WebApp 的 设计 模型 ， 发 现 导航 错误 。 

(4) 测试 用 户 界面 ， 发 现 表现 机 制 和 或) 导航 机 制 中 的 错误 。 

(5) 对 功能 构件 进行 单元 测试 。 

(6) 对 贯穿 体系 结构 的 导航 进行 测试 。 

(7) 在 各 种 不 同 的 环境 配置 下 实现 WebApp， 并 测试 WebApp 对 于 每 一 种 配置 的 兼容 性 。 

(8) 进行 安全 性 测试 ， 试 图 攻击 WebApp 或 其 所 处 环境 的 弱点 。 

(9) 进行 性 能 测试 。 

(10) 通过 可 监控 的 最 终 用 户 群 对 WebApp 进行 测试 ， 对 他 们 与 系统 的 交互 结果 进行 以 下 
方面 的 评估 ， 包 括 内 容 和 导航 错误 、 可 用 性 、 兼 容 性 以 及 WebApp 的 安全 性 、 可 靠 性 及 性 能 等 
方面 的 评估 。 

5.5.5 ”测试 方法 


在 软件 测试 过 程 中 ， 应 该 为 定义 软件 测试 模板 ， 即 将 特定 的 测试 方法 和 测试 用 例 设计 放 在 
一 系列 的 测试 步骤 中 。 

软件 测试 方法 分 为 静态 测试 和 动态 测试 。 

(1) 静态 测试 。 静 态 测试 是 指 被 测试 程序 不 在 机 器 上 运行 ， 而 是 采用 人 工 检 测 和 计算 机 辅 
助 静态 分 析 的 手段 对 程序 进行 检测 。 

Q 人 工 检测 。 人 工 检测 不 依靠 计算 机 而 是 依靠 人 工 审查 程序 或 评审 软件 ， 包 括 代码 检查 、 

@ 计算 机 辅助 静态 分 析 。 利 用 静态 分 析 工 具 对 被 测试 程序 进行 特性 分 析 ， 从 程序 中 提取 
一 些 信息 ， 以 便 检查 程序 逻辑 的 各 种 缺陷 和 可 疑 的 程序 构造 。 

(2) 动态 测试 。 动 态 测试 是 指 通过 运行 程序 发 现 错误 。 在 对 软件 产品 进行 动态 测试 时 可 以 
采用 黑 盒 测试 法 和 白 盒 测 试 法 。 

测试 用 例 由 测试 输入 数据 和 与 之 对 应 的 预期 输出 结果 组 成 。 在 设计 测试 用 例 时 ， 应 当 包 括 


国医 


国 ?74 若 。 软 人 设计 师 教程 (第 5 版) 


合理 的 输入 条 件 和 不 合理 的 输入 条 件 。 
1. 黑 盒 测 试 


黑 盒 测试 也 称 为 功能 测试 ， 在 完全 不 考虑 软件 的 内 部 结构 和 特性 的 情况 下 ， 测 试 软件 的 外 
部 特性 。 进 行 黑 盒 测试 主要 是 为 了 发 现 以 下 几 类 错误 。 

(1) 是 否 有 错误 的 功能 或 遗漏 的 功能 ? 

(2) 界面 是 否 有 误 ? 输入 是 否 正确 接收 ? 输出 是 否 正 确 ? 

(3) 是 否 有 数据 结构 或 外 部 数据 库 访问 错误 ? 

(4) 性 能 是 否 能 够 接受 ? 

(5) 是 否 有 初始 化 或 终止 性 错误 ? 

常用 的 黑 盒 测试 技术 有 等 价 类 划分 、 边 界 值 分 析 、 错 误 推 测 和 因果 图 等 。 

(1) 等 价 类 划分 。 等 价 类 划分 法 将 程序 的 输入 域 划分 为 若干 等 价 类 ， 然 后 从 每 个 等 价 类 中 
选取 一 个 代表 性 数据 作为 测试 用 例 。 每 一 类 的 代表 性 数据 在 测试 中 的 作用 等 价 于 这 一 类 中 的 其 
他 值 ， 这 样 就 可 以 用 少量 代表 性 的 测试 用 例 取得 较 好 的 测试 效果 。 等 价 类 划分 有 两 种 不 同 的 情 
况 : 有 效 等 价 类 和 无 效 等 价 类 。 在 设计 测试 用 例 时 ， 要 同时 考虑 这 两 种 等 价 类 。 

定义 等 价 类 的 原则 如 下 。 

Q@ 在 输入 条 件 规定 了 取 值 范围 或 值 的 个 数 的 情况 下 ， 可 以 定义 一 个 有 效 等 价 类 和 两 个 无 
效 等 价 类 。 

@ 在 输入 条 件 规定 了 输入 值 的 集合 或 规定 了 “必须 如 何 ” 的 条 件 的 情况 下 ， 可 以 定义 一 
个 有 效 等 价 类 和 一 个 无 效 等 价 类 。 

@ 在 输入 条 件 是 一 个 布尔 量 的 情况 下 ， 可 以 定义 一 个 有 效 等 价 类 和 一 个 无 效 等 价 类 。 

@ 在 规定 了 输入 数据 的 一 组 值 ( 假 定 个)， 并 且 程 序 要 对 每 一 个 输入 值 分 别处 理 的 情况 
下 ， 可 以 定义 n 个 有 效 等 价 类 和 一 个 无 效 等 价 类 。 

@@ 在 规定 了 输入 数据 必须 遵守 的 规则 的 情况 下 ， 可 以 定义 一 个 有 效 等 价 类 符合 规则 ) 
和 若干 个 无 效 等 价 类 (从 不 同 角度 违反 规则 )。 

@ 在 确 知已 划分 的 等 价 类 中 ， 各 元 素 在 程序 处 理 中 的 方式 不 同 的 情况 下 ， 则 应 将 该 等 价 
类 进一步 划分 为 更 小 的 等 价 类 。 

定义 好 等 价 类 之 后 ， 建 立 等 价 类 表 ， 并 为 每 个 等 价 类 编号 。 在 设计 一 个 新 的 测试 用 例 时 ， 
使 其 尽 可 能 多 地 履 盖 尚未 覆盖 的 有 效 等 价 类 ， 不 断 重复 ， 最 后 使 得 所 有 有 效 等 价 类 均 被 测试 用 
例 覆 盖 。 然 后 设计 一 个 新 的 测试 用 例 ， 使 其 只 覆盖 一 个 无 效 等 价 类 。 

(2) 边界 值 分 析 。 输 入 的 边界 比 中 间 更 加 容易 发 生 错误 ， 因 此 用 边界 值 分 析 来 补充 等 价 类 
划分 的 测试 用 例 设计 技术 。 边 界 值 划分 选择 等 价 类 边界 的 测试 用 例 ， 既 注重 于 输入 条 件 边界 ， 
又 适用 于 输出 域 测试 用 例 。 
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对 边界 值 设计 测试 用 例 应 遵循 的 原则 如 下 。 

@ 如 果 输 入 条 件 规定 了 值 的 范围 ， 则 应 取 刚 达到 这 个 范围 的 边界 的 值 ， 以 及 刚刚 超越 这 
个 范围 边界 的 值 作为 测试 输入 数据 。 

@ 如 果 输 入 条 件 规定 了 值 的 个 数 ， 则 用 最 大 个 数 、 最 小 个 数 、 比 最 小 个 数 少 1、 比 最 大 个 
数 多 1 的 数据 作为 测试 数据 。 

@ 根据 规格 说 明 的 每 个 输出 条 件 使 用 上 述 两 条 原则 。 

图 如 果 程 序 的 规格 说 明 给 出 的 输入 域 或 输出 域 是 有 序 集合 ， 则 应 选取 集合 的 第 一 个 元 素 
和 最 后 一 个 元 素 作为 测试 用 例 。 

@ 如 果 程 序 中 使 用 了 一 个 内 部 数据 结构 ， 则 应 当选 择 这 个 内 部 数据 结构 边界 上 的 值 作为 
测试 用 例 。 

@ 分 析 规 格 说 明 ， 找 出 其 他 可 能 的 边界 条 件 。 

(3) 错误 推测 。 错 误 推 测 是 基于 经 验 和 直觉 推测 程序 中 所 有 可 能 存在 的 各 种 错误 ， 从 而 有 
针对 性 地 设计 测试 用 例 的 方法 。 其 基本 思想 是 列举 出 程序 中 所 有 可 能 有 的 错误 和 容易 发 生 错 误 
的 特殊 情况 ， 根 据 它 们 选择 测试 用 例 。 

(4) 因果 图 。 因 果 图 法 是 从 自然 语言 描述 的 程序 规格 说 明 中 找 出 因 〈 输 入 条 件 ) 和 果 输 
出 或 程序 状态 的 改变 )， 通 过 因果 图 转换 为 判定 表 。 

利用 因果 图 导出 测试 用 例 需要 经 过 以 下 几 个 步骤 。 

@ 分 析 程序 规格 说 明 的 描述 中 哪些 是 原因 ， 哪 些 是 结果 ， 原 因 常 常 是 输入 条 件 或 是 输入 
条 件 的 等 价 类 ， 而 结果 是 输出 条 件 。 

@ 分 析 程 序 规格 说 明 的 描述 中 语义 的 内 容 , 并 将 其 表示 成 连接 各 个 原因 与 各 个 结果 的 “ 因 
果 图 ”。 

@ 标明 约束 条 件 。 由 于 语法 或 环境 的 限制 ， 有 些 原因 和 结果 的 组 合 情 况 是 不 可 能 出 现 的 。 
为 表明 这 些 特定 的 情况 ， 在 因果 图 上 使 用 若干 个 标准 的 符号 标明 约束 条 件 。 

@ 把 因果 图 转换 成 判定 表 。 

@ 为 判定 表 中 每 一 列表 示 的 情况 设计 测试 用 例 。 

这 样 生成 的 测试 用 例 〈 局 部 ， 组 合 关系 下 的 ) 包括 了 所 有 输入 数据 的 取 “ 真 ”和 取 “ 假 ” 
的 情况 ， 构 成 的 测试 用 例 数据 达到 最 少 ， 且 测试 用 例 数据 随 输 入 数据 数目 的 增加 而 增加 。 


2. 白 盒 测试 

白 盒 测 试 也 称 为 结构 测试 ， 根 据 程序 的 内 部 结构 和 罗 辑 来 设计 测试 用 例 ， 对 程序 的 路 径 和 
过 程 进行 测试 ， 检 查 是 否 满足 设计 的 需要 。 

盒 测试 常用 的 技术 是 逻辑 覆盖 、 循 环 覆 六 和 基本 路 径 测试 。 

(1) 逻辑 覆盖 。 风 辑 覆 六 考察 用 测试 数据 运行 被 测 程序 时 对 程序 逻辑 的 覆盖 程度 ， 主 要 的 
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逻辑 覆盖 标准 有 语句 覆盖 、 判 定 覆盖 、 条 件 覆 盖 、 判 定 /条 件 覆 盖 、 条 件 组 合 覆 盖 和 路 径 覆 
盖 6 种 。 

Q@ 语句 覆盖 。 语 名 覆盖 是 指 选择 足够 的 测试 数据 ， 使 被 测试 程序 中 的 每 条 语句 至 少 执行 
一 次 。 语 句 覆 盖 对 程序 执行 逻辑 的 覆盖 很 低 ， 因 此 一 般 认为 它 是 很 弱 的 逻辑 覆盖 。 

@ 判定 覆盖 。 判 定 覆盖 是 指 设计 足够 的 测试 用 例 ， 使 得 被 测 程序 中 的 每 个 判定 表达 式 至 
少 获 得 一 次 “ 真 ” 值 和 “ 假 ” 值 ， 或 者 说 是 程序 中 的 每 一 个 取 “ 真 ”分 支 和 取 “ 假 ”分 支 至 少 
都 通过 一 次 ， 因 此 判定 覆盖 也 称 为 分 支 覆 盖 。 判 定 覆 盖 要 比 语句 覆盖 更 强 一 些 。 

@ 条 件 覆 盖 。 条 件 覆 盖 是 指 构造 一 组 测试 用 例 ， 使 得 每 一 判定 语句 中 每 个 多 辑 条 件 的 各 
种 可 能 的 值 至 少 满足 一 次 。 

@ 判定 /条 件 覆 盖 。 判 定 /条 件 覆 盖 是 指 设计 足够 的 测试 用 例 ， 使 得 判定 中 每 个 条 件 的 所 有 
J 能 取 值 〈 真 / 假 〉 至 少 出 现 一 次 ， 并 使 每 个 判定 本 身 的 判定 结果 〔 真 / 假 ) 也 至 少 出 现 一 次 。 
@ 条 件 组 合 覆 盖 。 条 件 组 合 覆 盖 是 指 设计 足够 的 测试 用 例 ， 使 得 每 个 判定 中 条 件 的 各 种 
可 能 值 的 组 合 都 至 少 出 现 一 次 。 满 足 条 件 组 合 覆 盖 的 测试 用 例 是 一 定 满足 判定 覆盖 、 条 件 覆 盖 
和 判定 /条 件 履 盖 的 。 

@ 路 径 覆 盖 。 路 径 覆 盖 是 指 覆 盖 被 测试 程序 中 所 有 可 能 的 路 径 。 

(2) 循环 覆盖 。 执 行 足够 的 测试 用 例 ， 使 得 循环 中 的 每 个 条 件 都 得 到 验证 。 

(3) 基本 路 径 测 试 。 基 本 路 径 测试 法 是 在 程序 控制 流 图 的 基础 上 通过 分 析 控 制 流 图 的 环 路 
复杂 性 ， 导 出 基本 可 执行 路 径 集合 ， 从 而 设计 测试 用 例 。 设 计 出 的 测试 用 例 要 保证 在 测试 中 程 
序 的 每 一 条 独立 路 径 都 执行 过 ， 即 程序 中 的 每 条 可 执行 语句 至 少 执行 一 次 。 此 外 ， 所 有 条 件 语 
句 的 真 值 状 态 和 假 值 状态 都 测试 过 。 路 径 测 试 的 起 点 是 程序 控制 流 图 。 程 序 控制 流 图 中 的 结 点 
代表 包含 一 个 或 多 个 无 分 支 的 语句 序列 ， 边 代表 控制 流 。 

白 盒 测 试 的 原则 如 下 。 

(1) 程序 模块 中 的 所 有 独立 路 径 至 少 执行 一 次 。 

(2) 在 所 有 的 迪 辑 判断 中 ， 取 “ 真 ” 和 取 “ 假 ”的 两 种 情况 至 少 都 能 执行 一 次 。 

(3) 每 个 循环 都 应 在 边界 条 件 和 一 般 条 件 下 各 执行 一 次 。 

(4) 测试 程序 内 部 数据 结构 的 有 效 性 等 。 


5.5.6 调试 


调试 发 生 在 测试 之 后 ， 其 任务 是 根据 测试 时 所 发 现 的 错误 找 出 原因 和 具体 的 位 置 ， 进 行 改 
正 。 调 试 工作 主要 由 程序 开发 人 员 进 行 ， 谁 开发 的 程序 就 由 谁 来 进行 调试 。 

1. 调试 过 程 

调试 并 不 是 测试 ， 且 总 是 发 生 在 测试 之 后 。 执 行 测试 用 例 ， 对 测试 结果 进行 评估 ， 当 期 望 
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的 表现 与 实际 表现 不 一 致 时 ， 调 试 过 程 就 开始 了 。 在 很 多 情况 下 ， 这 种 不 一 致 的 数据 是 隐藏 在 
背后 的 某 种 原因 所 变现 出 来 的 症状 。 调 试 试图 找到 隐藏 在 症状 背后 的 原因 ， 从 而 使 错误 得 到 
修正 。 

调试 过 程 通常 得 到 以 下 两 种 结果 之 一 : 发 现 问题 的 原因 并 将 其 改正 ; 未 能 找到 问题 的 原因 。 
在 后 一 种 情况 下 , 调试 人 员 可 以 假设 一 个 原因 , 设计 一 个 或 多 个 测试 用 例 来 帮助 验证 这 个 假设 ， 
重复 此 过 程 直到 改正 错误 。 

调试 是 非常 困难 的 , 这 是 因为 在 很 大 程度 上 , 人 类 的 心理 比 软件 技术 与 其 有 更 密切 的 关系 。 
软件 Bug 的 以 下 特征 为 开发 者 进行 调试 提供 了 一 些 线索 。 

(1) 症状 与 原因 出 现 的 地 方 可 能 相隔 很 远 。 也 就 是 说 ， 症 状 可 能 在 程序 的 一 个 地 方 出 现 ， 
而 原因 实际 上 可 能 在 很 远 的 另 一 个 地 方 。 高 度 耦 合 的 构件 加 剧 了 这 种 情况 的 发 生 。 

(2) 症状 可 能 在 另 一 个 错误 被 改正 时 (暂时 ) 消失 。 

(3) 症状 实际 上 可 能 是 由 非 错误 因素 (例如 ， 舍 入 误差 ) 引起 的 。 

(4) 症状 可 能 是 由 不 易 追 踪 的 人 为 错误 引起 的 。 

(5) 症状 可 能 是 有 计时 间 题 而 不 是 处 理 问 题 引起 的 。 

(6) 重新 产生 完全 一 样 的 输入 条 件 是 困难 的 (例如 ， 输 入 顺序 不 确定 的 实时 应 用 系统 )。 

(7) 症状 可 能 时 有 时 无 ， 这 在 软 /硬件 耦合 的 嵌入 式 系统 中 尤为 常见 。 

(8) 症状 可 能 是 由 分 布 运 行 在 不 同 处 理 器 上 的 很 多 任务 引起 的 。 

2. 调试 方法 

目前 ， 常 用 的 调试 方法 有 以 下 几 种 。 

1) 试探 法 

调试 人 员 分 析 错 误 的 症状 ， 猜 测 问题 所 在 的 位 置 ， 利 用 在 程序 中 设置 输出 语句 ， 分 析 寄 存 
器 、 存 储 器 的 内 容 等 手段 获得 错误 的 线索 ， 一 步 步 地 试探 和 分 析出 错误 所 在 。 这 种 方法 效率 很 
低 ， 适 合 于 结构 比较 简单 的 程序 。 

2) 回 洲 法 

调试 人 员 从 发 现 错误 症状 的 位 置 开始 ， 人 工 沿 着 程序 的 控制 流程 往 回 跟踪 代码 ， 直 到 找 出 
错误 根源 为 止 。 这 种 方法 适合 于 小 型 程序 ， 对 于 大 规模 程序 ， 由 于 其 需要 回溯 的 路 径 太 多 而 变 
得 不 可 操作 。 

3) 对 分 查找 法 

这 种 方法 主要 用 来 缩小 错误 的 范围 ， 如 果 已 经 知道 程序 中 的 变量 在 若干 位 置 的 正确 取 值 ， 
可 以 在 这 些 位 置 上 给 这 些 变量 以 正确 值 ， 观 察 程 序 运行 的 输出 结果 ， 如 果 没 有 发 现 问题 ， 则 说 
明 从 赋予 变量 一 个 正确 值 开始 到 输出 结果 之 间 的 程序 没有 错误 ， 问 题 可 能 在 除 此 之 外 的 程序 
中 。 和 否则 错误 就 在 所 考察 的 这 部 分 程序 中 ， 对 含有 错误 的 程序 段 再 使 用 这 种 方法 ， 直 到 把 故障 
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范围 缩小 到 比较 容易 诊断 为 止 。 

4) 归纳 法 

归纳 法 就 是 从 测试 所 暴露 的 问题 出 发 ， 收 集 所 有 正确 或 不 正确 的 数据 ， 分 析 它 们 之 间 的 关 
系 ， 提 出 假想 的 错误 原因 ， 用 这 些 数据 来 证 明 或 反驳 ， 从 而 查 出 错误 所 在 。 

5) 演绎 法 

演绎 法 根据 测试 结果 ， 列 出 所 有 可 能 的 错误 原因 ; 分 析 已 有 的 数据 ， 排 除 不 可 能 和 彼此 了 矛 
盾 的 原因 ; 对 其 余 的 原因 ， 选 择 可 能 性 最 大 的 ， 利 用 已 有 的 数据 完善 该 假设 ， 使 假设 更 具体 ; 
用 假设 来 解释 所 有 的 原始 测试 结果 ， 如 果 能 解释 这 一 切 ， 则 假设 得 以 证 实 ， 也 就 找 出 错误 ， 否 
则 ， 要 么 是 假设 不 完备 或 不 成 立 ， 要 么 有 多 个 错误 同时 存在 ， 需 要 重新 分 析 ， 提 出 新 的 假设 
直到 发 现 错误 为 止 。 


5.6 ”运行 和 维护 知识 


5.6.1 系统 转换 


在 进行 新 旧 系统 转换 以 前 ， 首 先 要 进行 新 系统 的 试 运行 。 在 系统 测试 、 调 试 中 ， 使 用 的 是 
系统 测试 数据 ， 有 些 实际 运行 中 可 能 出 现 的 问题 很 难 通过 这 些 数据 被 发 现 。 所 以 ， 一 个 系统 开 
发 后 ， 让 它 实际 运行 一 段 时 间 ， 是 对 系统 最 好 的 检验 和 测试 方法 。 

系统 试 运行 阶段 的 主要 工作 如 下 。 

(1) 对 系统 进行 初始 化 、 输 入 各 种 原始 数据 记录 。 

(2) 记录 系统 运行 的 数据 和 状况 。 

(3) 核对 新 系统 输出 和 旧 系 统 〈 人 工 或 计算 机 系统 ) 输出 的 结果 。 

(4) 对 实际 系统 的 输入 方式 进行 考察 (是否 方 便 、 效 率 如 何 、 安 全 可 靠 性 、 误 操作 保护 等 )。 

(5) 对 系统 实际 运行 、 响 应 速度 〈 包 括 运算 速度 、 传 递 速度 、 查 询 速度 和 输出 速度 等 ) 进 
行 实际 测试 。 

新 系统 试 运行 成 功 之 后 ， 就 可 以 在 新 系统 和 旧 系 统 之 间 互 相 转换 。 新 旧 系统 之 间 的 转换 方 
式 有 直接 转换 、 并 行 转换 和 分 段 转换 。 

(1) 直接 转换 。 直 接 转 换 就 是 在 确定 新 系统 运行 无 误 时 立刻 启用 新 系统 , 终止 旧 系 统 运行 。 
这 种 方式 很 节省 人 员 、 设 备 费用 。 这 种 方式 一 般 适 用 于 一 些 处 理 过 程 不 太 复杂 、 数 据 不 太 重 要 
的 场合 。 

(2) 并 行 转换 。 这 种 转换 方式 是 新 旧 系 统 并 行 工作 一 段 时 间 ， 经 过 一 段 时 间 的 考验 以 后 ， 
新 系统 正式 替代 旧 系统 。 对 于 较 复 杂 的 大 型 系统 ， 它 提供 了 一 个 与 旧 系 统 运行 结果 进行 比较 的 
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机 会 ， 可 以 对 新 旧 两 个 系统 的 时 间 要 求 、 出 错 次 数 和 工作 效率 给 予 公正 的 评价 。 当 然 ， 由 于 与 
旧 系统 并 行 工 作 ， 消 除了 尚未 认识 新 系统 之 前 的 紧张 和 不 安 。 在 银行 、 财 务 和 一 些 企业 的 核心 
系统 中 ,这 是 一 种 经 常 使 用 的 转换 方式 。 它 的 主要 特点 是 安全 、 可 靠 , 但 费用 和 工作 量 都 很 大 ， 
因为 在 相当 长 的 时 间 内 系统 要 新 、 旧 两 套 并 行 工作 。 

(3) 分 段 转换 。 分 段 转换 又 称 逐 步 转换 、 向 导 转 换 、 试 点 过 渡 法 等 。 这 种 转换 方式 实际 上 
是 以 上 两 种 转换 方式 的 结合 。 在 新 系统 全 部 正式 运行 前 ， 一 部 分 一 部 分 地 代替 旧 系 统 。 那 些 在 
转换 过 程 中 还 没有 正式 运行 的 部 分 ， 可 以 在 一 个 模拟 环境 中 继续 试 运行 。 这 种 方式 既 保证 了 可 
靠 性 ， 又 不 至 于 费用 太 大 。 但 是 ， 这 种 分 段 转换 要 求 子 系统 之 间 有 一 定 的 独立 性 ， 对 系统 的 设 
计 和 实现 都 有 一 定 的 要 求 ， 否 则 无 法 实现 这 种 分 段 转换 的 设想 。 

在 实际 工作 中 ， 转 换 方法 较为 灵活 。 一 个 信息 系统 从 使 用 到 成 熟 再 到 提高 ， 是 一 个 比较 长 
的 过 程 。 只 有 遵循 数据 处 理 的 阶段 性 ， 信 息 系统 才能 健康 发 展 。 现 以 一 个 连锁 企业 开始 实施 新 
系统 为 例 进行 介绍 。 

(1) 初始 阶段 。 企 业 首 先 为 应 用 系统 做 基本 资料 的 准备 ， 进 行 总 部 、“ 配 送 ” 核 心 系统 的 
实施 。 

(2) 推广 阶段 。 总 部 “配送 ”系统 稳定 后 ， 先 从 1 一 2 家 门店 试点 开始 ， 以 门店 核心 模块 
为 主 ， 完 成 门店 与 总 部 的 信息 交换 、 物 流 过 程 。 然 后 再 逐步 推广 门店 系统 ， 直 到 完成 所 有 门店 
的 联网 工作 。 

(3) 控制 阶段 。 所 有 门店 联网 完成 后 ， 进 行 准确 、 及 时 的 基本 数据 采集 和 调整 工作 。 

(4) 集成 阶段 。 考 虑 自动 补 货 、 自 动 配 货 、 财 务 接口 等 高 级 模块 应 用 的 工作 。 

(5) 管理 阶段 。 进 入 数据 的 全 面 启用 和 介入 管理 决策 。 最 后 ， 系 统 步 入 成 熟 阶段 。 

实际 上 ， 每 个 企业 在 不 同 阶段 的 发 展 过 程 中 对 有 具体 问题 的 解决 方法 是 不 同 的 ， 随 时 都 会 进 
行 以 上 阶段 的 周期 重复 ， 随 着 每 次 重复 时 起 点 的 不 断 升 高 ， 整 个 企业 的 数据 应 用 水 平 也 就 随 之 
逐步 提高 了 。 


5.6.2 系统 维护 概述 


软件 维护 是 软件 生命 周期 中 的 最 后 一 个 阶段 ， 处 于 系统 投入 生产 性 运行 以 后 的 时 期 中 ， 因 
此 不 属于 系统 开发 过 程 。 软 件 维护 是 在 软件 已 经 交付 使 用 之 后 为 了 改正 错误 或 满足 新 的 需求 而 
修改 软件 的 过 程 ， 即 软件 在 交付 使 用 后 对 软件 所 做 的 一 切 改动 。 


1. 系统 可 维护 性 概念 


系统 的 可 维护 性 可 以 定义 为 维护 人 员 理 解 、 改 正 、 改 动 和 改进 这 个 软件 的 难 易 程度 。 提 高 
可 维护 性 是 开发 软件 系统 所 有 步骤 的 关键 目的 ， 系 统 是 否 能 被 很 好 地 维护 ， 可 以 用 系统 的 可 维 
护 性 这 一 指标 来 衡量 。 
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1) 系统 可 维护 性 的 评价 指标 

(1) 可 理解 性 。 指 别人 能 理解 系统 的 结构 、 界 面 、 功 能 和 内 部 过 程 的 难 易 程度 。 模 块 化 、 
详细 设计 文档 、 结 构 化 设计 和 良好 的 高 级 程序 设计 语言 等 都 有 助 于 提高 可 理解 性 。 

(2) 可 测试 性 。 诊 断 和 测试 的 容易 程度 取决 于 易 理解 的 程度 。 好 的 文档 资料 有 利于 诊断 和 
测试 ， 同 时 ， 程 序 的 结构 、 高 性 能 的 测试 工具 以 及 周密 计划 的 测试 工序 也 是 至 关 重 要 的 。 为 此 ， 
发 人 员 在 系统 设计 和 编程 阶段 就 应 尽力 把 程序 设计 成 易 诊 断 和 测试 的 。 此 外 ， 在 进行 系统 维 
护 时 ， 应 该 充分 利用 在 系统 测试 阶段 保存 下 来 的 测试 用 例 。 

(3) 可 修改 性 。 诊 断 和 测试 的 容易 程度 与 系统 设计 所 制定 的 设计 原则 有 直接 关系 。 模 块 的 
耦合 、 内 聚 、 作 用 范围 与 控制 范围 的 关系 等 都 对 可 修改 性 有 影响 。 

2) 维护 与 软件 文档 

文档 是 软件 可 维护 性 的 决定 因素 。 由 于 长 期 使 用 的 大 型 软件 系统 在 使 用 过 程 中 必然 会 经 受 
多 次 修改 ， 所 以 文档 显得 非常 重要 。 

软件 系统 的 文档 可 以 分 为 用 户 文档 和 系统 文档 两 类 。 用 户 文档 主要 描述 系统 功能 和 使 用 方 
法 ， 并 不 关心 这 些 功能 是 怎样 实现 的 ;系统 文档 描述 系统 设计 、 实 现 和 测试 等 各 方面 的 内 容 。 

可 维护 性 是 所 有 软件 都 应 具有 的 基本 特点 ， 必 须 在 开发 阶段 保证 软件 具有 可 维护 的 特点 。 
在 软件 工程 的 每 一 个 阶段 都 应 考虑 并 提高 软件 的 可 维护 性 ， 在 每 个 阶段 结束 前 的 技术 审查 和 管 
理 复查 中 应 该 着 重 对 可 维护 性 进行 复审 。 

在 系统 分 析 阶 段 的 复审 过 程 中 ， 应 该 对 将 来 要 改进 的 部 分 和 可 能 会 修改 的 部 分 加 以 注解 并 
指明 ， 并 且 指 出 软件 的 可 移植 性 问题 以 及 可 能 影响 软件 维护 的 系统 界面 ; 在 系统 设计 阶段 的 复 
审 期 间 ， 应 该 从 容易 修改 、 模 块 化 和 功能 独立 的 目的 出 发 ， 评 价 软件 的 结构 和 过 程 ; 在 系统 实 
施 阶段 的 复审 期 间 ， 代 码 复审 应 该 强调 编码 风格 和 内 部 说 明文 档 这 两 个 影响 可 维护 性 的 因素 。 
在 完成 了 每 项 维护 工作 之 后 ， 都 应 该 对 软件 维护 本 身 进 行 认真 的 复审 。 

3) 软件 文档 的 修改 

维护 应 该 针对 整个 软件 配置 ， 不 应 该 只 修改 源 程序 代码 。 如 果 对 源 程序 代码 的 修改 没有 反 
映 在 设计 文档 或 用 户 手 册 中 ， 可 能 会 产生 严重 的 后 果 。 每 当 对 数据 、 软 件 结 构 、 模 块 过 程 或 任 
何其 他 有 关 的 软件 特点 做 了 改动 时 ， 必 须 立 即 修改 相应 的 技术 文档 。 不 能 准确 反映 软件 当前 状 
态 的 设计 文档 可 能 比 完全 没有 文档 更 坏 。 在 以 后 的 维护 工作 中 ， 用 户 很 可 能 因 文档 不 完全 符合 
实际 而 不 能 正确 地 理解 软件 ， 从 而 在 维护 中 引入 过 多 的 错误 。 


2. 系统 维护 的 内 容 及 类 型 


系统 维护 主要 包括 硬件 维护 、 软 件 维护 和 数据 维护 。 
1) 硬件 维护 
硬件 维护 应 由 专职 的 硬件 维护 人 员 来 负责 ， 主 要 有 两 种 类 型 的 维护 活动 : 一 种 是 定期 的 设 
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备 保 养性 维护 ， 保 养 周 期 可 以 是 一 周 或 一 个 月 不 等 ， 维 护 的 主要 内 容 是 进行 例 行 的 设备 检查 与 
保养 ， 易 耗 品 的 更 换 与 安装 等 ， 另 一 种 是 突 发 性 的 故障 维护 ， 即 当 设 备 出 现 突 发 性 故障 时 ， 由 
专职 的 维修 人 员 或 请 三 方 的 技术 人 员 来 排除 故障 ， 这 种 维修 活动 所 花 的 时 间 不 能 过 长 ， 以 免 影 
响 系统 的 正常 运行 。 

2) 软件 维护 

软件 维护 主要 是 指 根据 需求 变化 或 硬件 环境 的 变化 对 应 用 程序 进行 部 分 或 全 部 修改 。 修 改 
时 应 充分 利用 源 程序 ， 修 改 后 要 填写 程序 修改 登记 表 ， 并 在 程序 变更 通知 书 上 写 明 新 旧 程 序 的 
不 同 之 处 。 

软件 维护 的 内 容 一 般 有 以 下 几 个 方面 。 

(1) 正确 性 维护 。 正 确 性 维护 是 指 改正 在 系统 开发 阶段 已 发 生 而 系统 测试 阶段 尚未 发 现 的 
错误 。 这 方面 的 维护 工作 量 要 占 整 个 维护 工作 量 的 17% 一 21%。 所 发 现 的 错误 有 的 不 太 重要 ， 
不 影响 系统 的 正常 运行 ， 其 维护 工作 可 随时 进行 ， 而 有 的 错误 非常 重要 ， 甚 至 会 影响 整个 系统 
的 正常 运行 ， 其 维护 工作 必须 制定 计划 ， 进 行 修改 ， 并 且 要 进行 复查 和 控制 。 

(2) 适应 性 维护 。 适 应 性 维护 是 指使 应 用 软件 适应 信息 技术 变化 和 管理 需求 变化 而 进行 的 
修改 。 这 方面 的 维护 工作 量 占 整个 维护 工作 量 的 18% 一 25%。 由 于 目前 计算 机 硬件 价格 不 断 下 
降 ， 各 类 系统 软件 层出不穷 ， 人 们 常常 为 改善 系统 硬件 环境 和 运行 环境 而 产生 系统 更 新 换代 的 
需求 ; 企业 的 外 部 市 场 环 境 和 管理 需求 的 不 断 变 化 也 使 得 各 级 管理 人 员 不 断 提出 新 的 信息 需 
求 。 这 些 因素 都 将 导致 适应 性 维护 工作 的 产生 。 进 行 这 方面 的 维护 工作 也 要 像 系统 开发 一 样 ， 
有 计划 、 有 步骤 地 进行 。 

(3) 完善 性 维护 。 这 是 为 扩充 功能 和 改善 性 能 而 进行 的 修改 ， 主 要 是 指 对 已 有 的 软件 系统 
增加 一 些 在 系统 分 析 和 设计 阶段 中 没有 规定 的 功能 与 性 能 特征 。 这 些 功 能 对 完善 系统 功能 是 非 
常 必 要 的 。 另 外 ， 它 还 包括 对 处 理 效率 和 编写 程序 的 改进 ， 这 方面 的 维护 占 整 个 维护 工作 的 
50% 一 60%， 比 重 较 大 ， 也 是 关系 到 系统 开发 质量 的 重要 方面 。 这 方面 的 维护 除了 要 有 计划 、 
有 步骤 地 完成 外 ， 还 要 注意 将 相关 的 文档 资料 加 入 到 前 面相 应 的 文档 中 。 

(4) 预防 性 维护 。 为 了 改进 应 用 软件 的 可 靠 性 和 可 维护 性 ,为 了 适应 未 来 的 软 /硬件 环境 的 
变化 ， 应 主动 增加 预防 性 的 新 的 功能 ， 以 使 应 用 系统 适应 各 类 变化 而 不 被 淘汰 。 例 如 将 专用 报 
表 功 能 改 成 通用 报表 生成 功能 ， 以 适应 将 来 报表 格式 的 变化 。 这 方面 的 维护 工作 量 占 整个 维护 
工作 量 的 4% 左 右 。 

3) 数据 维护 

数据 维护 工作 主要 是 由 数据 库 管理 员 来 负责 ， 主 要 负责 数据 库 的 安全 性 和 完整 性 以 及 进行 
并 发 性 控制 。 数 据 库 管理 员 还 要 负责 维护 数据 库 中 的 数据 ， 当 数据 库 中 的 数据 类 型 、 长 度 等 发 
生变 化 时 ， 或 者 需要 添加 某 个 数据 项 、 数 据 库 时 ， 要 负责 修改 相关 的 数据 库 、 数 据 字典 ， 并 通 
知 有 关 人 员 。 另 外 ， 数 据 库 管 理 员 还 要 负责 定期 出 版 数据 字典 文件 及 一 些 其 他 数据 管理 文件 ， 
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以 保留 系统 运行 和 修改 的 轨迹 。 当 系统 出 现 硬件 故障 并 得 到 排除 后 , 要 负责 数据 库 的 恢复 工作 。 

数据 维护 中 还 有 一 项 很 重要 的 内 容 , 那 就 是 代码 维护 。 不 过 代码 维护 发 生 的 频率 相对 较 小 。 
代码 的 维护 应 由 代码 管理 小 组 进行 。 变 更 代码 应 经 过 详细 讨论 ， 确 定之 后 要 用 书面 形式 贯彻 。 
代码 维护 的 困难 往往 不 在 于 代码 本 身 的 变更 ， 而 在 于 新 代码 的 贯彻 。 为 此 ， 除 了 成 立 专门 的 代 
码 管理 小 组 外 ， 各 业务 部 门 要 指定 专人 进行 代码 管理 ， 通 过 他 们 贯彻 使 用 新 代码 。 这 样 做 的 目 
的 是 要 明确 管理 职责 ， 有 助 于 防止 和 更 正 错 误 。 


3. 系统 维护 的 管理 和 步骤 


需要 强调 的 是 ， 系 统 的 修改 往往 会 “ 牵 一 发 而 动 全 身 ”。 程 序 、 文 件 、 代 码 的 局 部 修改 都 
可 能 影响 系统 的 其 他 部 分 。 因 此 ， 系 统 的 维护 工作 应 有 计划 、 有 步骤 地 统筹 安排 ， 按 照 维护 任 
务 的 工作 范围 、 严 重 程度 等 诸多 因素 确定 优先 顺序 ， 制 定 出 合理 的 维护 计划 ， 然 后 通过 一 定 的 
批准 手续 实施 对 系统 的 修改 和 维护 。 

通常 ， 对 系统 的 维护 应 执行 以 下 步骤 。 

(1) 提出 维护 或 修改 要 求 。 操 作 人 员 或 业务 领导 用 书面 形式 向 系统 维护 工作 的 主管 人 员 提 
出 对 某 项 工作 的 修改 要 求 。 这 种 修改 要 求 一 般 不 能 直接 向 程序 员 提 出 。 

(2) 领导 审查 并 做 出 答复 , 如 同意 修改 则 列 入 维护 计划 。 系 统 主管 人 员 进 行 一 定 的 调查 后 ， 
根据 系统 的 情况 和 工作 人 员 的 情况 ， 考 虑 这 种 修改 是 否 必要 、 是 否 可 行 ， 做 出 是 否 修 改 、 何 时 
修改 的 答复 。 如 果 需 要 修改 ， 则 根据 优先 程度 的 不 同 列 入 系统 维护 计划 。 计 划 的 内 容 应 包括 维 
护 工作 的 范围 、 所 需 资源 、 确 认 的 需求 、 维 护 费 用 、 维 护 进 度 安排 以 及 验收 标准 等 。 

(3) 领导 分 配 任务 ， 维 护 人 员 执 行 修改 。 系 统 主管 人 员 按 照 计 划 向 有 关 的 维护 人 员 下 达 任 
务 ， 说 明 修 改 的 内 容 、 要 求 和 期 限 。 维 护 人 员 在 仔细 了 解 原 系统 的 设计 和 开发 思路 的 情况 下 对 
系统 进行 修改 。 

(4) 验收 维护 成 果 并 登记 修改 信息 。 系 统 主管 人 员 组 织 技术 人 员 对 修改 部 分 进行 测试 和 验 
收 。 验 收 通 过 后 ， 将 修改 的 部 分 嵌入 系统 ， 取 代 旧 的 部 分 。 维 护 人 员 登 记 所 做 的 修改 ， 更 新 相 
关 的 文档 ， 并 将 新 系统 作为 新 的 版 本 通报 用 户 和 操作 人 员 ， 指 明 新 的 功能 和 修改 的 地 方 。 

在 进行 系统 维护 过 程 中 ， 还 要 注意 维护 的 副作用 。 维 护 的 副作用 包括 两 个 方面 : 一 是 修改 
程序 代码 有 时 会 发 生 灾难 性 的 错误 ， 造 成 原来 运行 比较 正常 的 系统 变 得 不 能 正常 运行 。 为 了 避 
免 这 类 错误 ， 要 在 修改 工作 完成 后 进行 测试 ， 直 到 确认 和 复查 无 错 为 止 。 二 是 修改 数据 库 中 数 
据 的 副作用 ， 当 一 些 数据 库 中 的 数据 发 生变 化 时 可 能 导致 某 些 应 用 软件 不 再 适应 这 些 已 经 变化 
了 的 数据 而 产生 错误 。 为 了 避免 这 类 错误 ， 一 是 要 有 严格 的 数据 描述 文件 ， 即 数据 字典 系统 ; 
二 是 要 严格 记录 这 些 修改 并 进行 修改 后 的 测试 工作 。 

总 之 ， 系 统 维护 工作 是 信息 系统 运行 阶段 的 重要 工作 内 容 ， 必 须 予 以 充分 的 重视 。 维 护 工 
作 做 得 好 ， 信 息 系统 的 作用 才能 够 得 以 充分 发 挥 ， 信 息 系统 的 寿命 也 就 越 长 。 
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5.6.3 系统 评价 
1. 系统 评价 概述 


信息 系统 的 评价 分 为 广义 和 狭义 两 种 。 广 义 的 信息 系统 评价 是 指 从 系统 开发 的 一 开始 到 结 
束 的 每 一 阶段 都 需要 进行 评价 。 狭 义 的 信息 系统 评价 则 是 指 在 系统 建成 并 投入 运行 之 后 所 进行 
的 全 面 、 综 合 的 评价 。 

按 评价 的 时 间 与 信息 系统 所 处 的 阶段 的 关系 又 可 从 总 体 上 把 广义 的 信息 系统 评价 分 成 立 
项 评价 、 中 期 评价 和 结 项 评价 。 

(1) 立项 评价 。 立 项 评价 指 信息 系统 方案 在 系统 开发 前 的 预 评价 ， 即 系统 规划 阶段 中 的 可 
行 性 研究 。 评 价 的 目的 是 决定 是 否 立 项 进行 开发 ， 评 价 的 内 容 是 分 析 当 前 开发 新 系统 的 条 件 是 
否 具备 ， 明 确 新 系统 目标 实现 的 重要 性 和 可 能 性 ， 主 要 包括 技术 上 的 可 行 性 、 经 济 上 的 可 行 性 、 
管理 上 的 可 行 性 和 开发 环境 的 可 行 性 等 方面 。 由 于 事前 评价 所 用 的 参数 大 多 是 不 确定 的 ， 所 以 
评价 的 结论 具有 一 定 的 风险 性 。 

(2) 中 期 评价 。 项 目 中 期 评价 包含 两 种 含义 ， 一 是 指 项 目 方案 在 实施 过 程 中 因 外 部 环境 出 
现 重 大 变化 (例如 市 场 需 求 变 化 、 竞 争 性 技术 或 更 完美 的 蔡 代 系统 出 现 ， 或 者 发 现 原先 的 设计 
有 重大 失误 等 ) 需要 对 项 目的 方案 进行 重新 评估 ， 以 决定 是 继续 执行 还 是 终止 该 方案 ， 另 一 种 
含义 也 可 称 为 阶段 评估 ， 是 指 在 信息 系统 开发 正常 的 情况 下 ， 对 系统 设计 、 系 统 分 析 、 系 统 实 
施 阶段 的 阶段 性 成 果 进 行 评 估 。 由 于 一 般 都 将 阶段 性 成 果 的 提交 视 为 信息 系统 建设 的 里 程 碑 ， 
所 以 ， 阶 段 评估 又 可 称 为 里 程 碑 式 评价 。 

(3) 结 项 评价 。 信 息 系 统 的 建设 是 一 个 项 目 ， 是 项 目 就 需要 有 终结 时 间 。 结 项 评价 是 指 项 
目 准 备 结束 时 对 系统 的 评价 ， 一 般 是 指 在 信息 系统 投入 正式 运行 以 后 ， 为 了 了 解 系统 是 否 达到 
预期 的 目的 和 要 求 而 对 系统 运行 的 实际 效果 进行 的 综合 评价 。 所 以 ， 结 项 评价 又 是 狭义 的 信息 
系统 评价 。 信 息 系统 项 目的 鉴定 是 结 项 评价 的 一 种 正规 的 形式 。 结 项 评价 的 主要 内 容 包括 系统 
性 能 评价 、 系 统 的 经 济 效益 评价 以 及 企业 管理 效率 提高 、 管 理 水 平 改 善 、 管 理 人 员 劳 动 强度 减 
轻 等 问 接 效果 。 通 过 结 项 评价 ， 用 户 可 以 了 解 系统 的 质量 和 效果 ， 检 查 系统 是 否 符合 预期 的 目 
的 和 要 求 ， 开发 人 员 可 以 总 结 开发 工作 的 经 验 、 教 训 ， 这 对 今后 的 工作 十 分 有 益 。 

在 对 信息 系统 进行 评价 考核 时 ， 应 该 注意 以 下 几 个 问题 。 

(1) 信息 系统 通过 基本 资料 输入 、 进 货 、 订 货 、 盘 点 和 零售 等 各 个 环节 采集 进来 ， 其 中 任 
何 一 个 环节 的 数据 输入 出 现 问题 ， 都 将 导致 最 终 报表 的 不 准确 ， 而 报表 不 准确 就 意味 着 企业 决 
策 者 无 法 根据 报表 决定 企业 的 运作 ， 更 谈 不 上 数据 分 析 和 决策 支持 了 。 这 也 是 目前 大 部 分 使 用 
了 信息 系统 的 企业 普遍 存在 的 问题 。 究 竟 是 什么 原因 导致 了 数据 采集 的 不 准确 呢 ? 一 些 企业 错 
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误 地 将 数据 准确 性 作为 考核 信息 部 的 一 个 指标 ， 其 实数 据 不 准确 更 多 的 源 于 管理 上 存在 的 问 
题 ， 正 因为 数据 源头 非常 多 ， 所 造成 的 数据 不 一 致 的 问题 不 是 信息 部 都 能 解决 的 ， 最 终 数据 采 
集 的 成 败 将 由 最 高 管理 层 对 数据 采集 各 环节 的 管理 力度 所 决定 ， 而 数据 采集 的 成 败 又 将 最 终 决 
定 整个 信息 系统 应 用 的 成 败 。 

(2) 信息 系统 并 不 是 万 能 系统 。 在 系统 应 用 的 过 程 中 ， 有 些 问 题 是 信息 系统 擅长 解决 的 ， 
如 大 量 的 、 重 复 的、 规范 性 的 事务 处 理 ， 而 有 些 问题 是 信息 系统 不 擅长 解决 的 ， 如 特殊 的 、 侦 
然 的 、 不 规范 的 经 营 管理 内 容 。 让 信息 系统 做 不 擅长 的 工作 ， 势 必 在 应 用 的 过 程 中 投入 的 管理 
成 本 远 远大 于 它 所 产生 的 效益 。 对 于 这 种 灵活 、 多 变 的 情况 ， 不 妨 采用 人 工 处 理 或 通过 制度 的 
限制 ， 尽 量 避免 不 规范 的 行为 频繁 发 生 ， 从 而 真正 实现 企业 简单 复制 、 快 速 扩张 、 规 模 效 益 的 
目的 。 


2. 系统 评价 的 指标 


从 以 下 几 方 面 综合 考 虑 ， 建 立 起 一 套 指标 体系 理论 框架 。 

(1) 从 信息 系统 的 组 成 部 分 出 发 ， 信 息 系统 是 一 个 由 人 机 共同 组 成 的 系统 ， 所 以 可 以 按照 
运行 效果 和 用 户 需求 (人 )、 系 统 质量 和 技术 条 件 机 ) 这 两 条 线索 构造 指标 。 

(2) 从 信息 系统 的 评价 对 象 出 发 , 对 于 开发 方 来 说 , 他 们 所 关心 的 是 系统 质量 和 技术 水 平 ; 
对 于 用 户 方 而 言 ， 关 心 的 是 用 户 需 求 和 运行 质量 ， 系 统 外 部 环境 则 主要 通过 社会 效益 指标 来 
反映 。 

(3) 从 经 济 学 角度 出 发 ， 分 别 按 系 统 成 本 、 系 统 效 益 和 财务 指标 3 条 线索 建立 指标 。 


5.7 软件 项 目 管理 


在 经 历 了 软件 危机 和 大 量 的 软件 项 目 失败 以 后 ， 人们 对 软件 工程 产业 的 现状 进行 了 多 次 的 
分 析 ， 得 出 了 普遍 性 的 结论 : 软件 项 目 成 功率 非常 低 的 原因 可 能 就 是 项 目 管理 能 力 太 弱 。 由 于 
软件 本 身 的 特殊 性 及 复杂 性 ， 将 项 目 管理 思想 引入 软件 工程 领域 ， 就 形成 了 软件 项 目 管理 。 软 
件 项 目 管理 是 指 软件 生存 周期 中 软件 管理 者 所 进行 的 一 系列 活动 ， 其 目的 是 在 一 定 的 时 间 和 预 
设 范围 内 有 效 地 利用 人 力 、 资 源 、 技 术 和 工具 ， 使 软件 系统 或 软件 产品 按 原 定 计划 和 质量 要 求 
如 期 完成 。 


5.7.1 软件 项 目 管理 涉及 的 范围 


有 效 的 软件 项 目 管理 集中 在 4 个 P 上 , 即 人 员 (Person)、 产品 (Product)、 过程 (Procedure) 
和 项 目 (Project)。 
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1. 人 员 


人 员 是 软件 工程 项 目的 基本 要 素 和 关键 因素 ， 在 对 人 员 进 行 组 织 时 ， 有 必要 考虑 参与 软件 
过 程 〈 及 每 一 个 软件 项 目 ) 的 人 员 类 型 。 一 般 来 说 ， 可 以 分 为 以 下 5 类 。 

1) 项 目 管理 人 员 

项 目 管理 人 员 负 责 软件 项 目的 管理 工作 ， 其 负责 人 通常 称 为 项 目 经 理 。 项 目 经 理 除 了 要 求 
掌握 相应 的 软件 开发 技术 外 ， 更 多 的 应 具备 管理 人 员 应 有 的 技能 。 项 目 经 理 的 任务 就 是 要 对 项 
目 进 行 全 面 的 管理 ， 具 体 表 现在 对 项 目 目标 要 有 一 个 全 局 的 观点 ， 制 订 项 目 计 划 ， 监 控 项 目 进 
展 ， 控 制 反馈 ， 组 建 团 队 ， 在 不 确定 环境 下 对 不 确定 问题 进行 决策 ， 在 必要 的 时 候 进行 谈判 并 
解决 冲突 。 

2) 高 级 管理 人 员 

高 级 管理 人 员 可 以 是 领域 专家 ， 负 责 提 出 项 目的 目标 并 对 业务 问题 进行 定义 ， 这 类 业务 问 
题 经 常会 对 项 目 产生 较 大 的 影响 。 

3) 开发 人 员 

这 类 人 员 常 常 掌握 了 开发 一 个 产品 或 应 用 所 需 的 专门 技术 , 可 胜任 需求 分 析 、 设计、 编码 、 
测试 、 发 布 等 各 种 相关 的 开发 岗位 。 

4) 客户 

客户 是 一 组 可 说 明 待 开发 软件 的 需求 的 人 ， 也 包括 与 项 目 目标 有 关 的 其 他 风险 承担 者 。 

5) 最 终 用 户 

产品 或 应 用 提交 后 ， 那 些 与 产品 /应 用 进行 交互 的 人 称 为 最 终 用 户 。 

软件 项 目的 组 织 称 为 软件 项 目 组 ， 每 一 个 软件 项 目 组 都 有 上 述 的 人 员 参 与 ， 项 目 组 的 组 织 
必须 最 大 限度 地 发 挥 每 个 人 的 技术 和 能 力 。 


2. 产品 


在 进行 项 目 计 划 之 前 ， 应 该 首先 进行 项 目 定义 ， 也 就 是 定义 项 目 范围 ， 其 中 包括 建立 产品 
的 目的 和 范围 、 可 选 的 解决 方案 、 技 术 或 管理 的 约束 等 。 

软件 开发 者 和 客户 必须 一 起 定义 产品 的 目的 和 范围 。 一 般 情 况 下 ， 该 活动 作为 系统 工程 或 
业务 过 程 工 程 的 一 部 分 ， 持 续 到 软件 需求 分 析 阶 段 的 前 期 。 其 目的 是 从 客户 的 角度 定义 该 产品 
的 总 体 目 标 ， 但 不 必 考 虑 这 些 目 标 如 何 实现 。 软 件 范 围 定义 了 与 软件 产品 相关 的 数据 、 功 能 和 
行为 及 相关 的 约束 。 

软件 范围 是 通过 回答 下 列 问 题 来 定义 的 。 

1) 项 目 环境 

要 开发 的 软件 如 何 适应 于 大 型 的 系统 、 产 品 或 业务 环境 ， 该 环境 下 要 施加 什么 约束 ? 

2) 信息 目标 

软件 要 产生 哪些 客户 可 见 的 数据 对 象 作为 输出 ? 需要 什么 数据 对 象 作为 输入 ? 
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3) 功能 和 性 能 
软件 要 执行 什么 功能 才能 将 输入 数据 变换 成 输出 数据 ? 软件 需要 满足 什么 特殊 的 性 能 


要 求 ? 
软件 项 目 范围 必须 是 无 二 义 的 和 可 理解 的 , 为 控制 其 复杂 性 , 必要 时 还 需 对 问题 进行 分 解 。 
3. 过 程 


传统 的 项 目 管理 有 大 项 目 、 项 目 、 活 动 、 工 作 包 、 工 作 单元 等 多 种 分 解 层 次 ， 对 于 软件 项 
目 来 说 ， 强 调 的 是 对 其 进行 过 程控 制 ， 通 常 将 项 目 分 解 为 任务 、 子 任务 等 ， 其 分 解 准 则 是 基于 
软件 工程 的 过 程 。 

软件 过 程 提供 了 一 个 项 目 团队 要 选择 一 个 适合 于 待 开发 软件 的 过 程 模型 〈 软 件 过 程 模型 详 
见 4.2 节 )。 项 目 团队 必须 决定 哪 种 过 程 模型 最 适合 于 : 需要 该 产品 的 客户 和 从 事 开 发 工作 的 人 
员 ; 产品 本 身 的 特性 ， 软 件 团队 所 处 的 项 目 工作 环境 。 在 选 定 过 程 模型 后 ， 项 目 团队 可 以 基于 
这 组 过 程 框 架 活 动 来 制订 一 个 初步 的 项 目 计划 。 一 旦 确定 了 初步 计划 ， 过 程 分 解 就 开始 了 ， 也 
就 是 说 ， 必 须 制订 一 个 完整 的 计划 来 反映 框架 活动 中 所 需 完成 的 工作 任务 。 


4. 项 目 


进行 有 计划 和 可 控制 的 软件 项 目 是 管理 复杂 性 的 一 种 方式 。Reel 提出 了 包含 如 下 5 个 部 分 
常识 的 软件 项 目 方法 。 

1) 明确 目标 及 过 程 

充分 理解 待 解决 的 问题 ， 明 确定 义 项 目 目标 及 软件 范围 ， 为 项 目 小 组 及 活动 设置 明确 、 现 
实 的 目标 ， 并 充分 发 挥 相关 小 组 的 自主 性 。 

2) 保持 动力 

为 了 维持 动力 ， 项 目 管理 者 必须 提供 激励 措施 以 保持 人 员 变 动 为 绝对 最 小 量 。 小 组 应 该 强 
调 所 完成 的 每 个 任务 的 质量 ， 而 高 层 的 管理 应 该 尽量 不 干涉 项 目 小 组 的 工作 方式 。 

3) 跟踪 进展 

针对 每 个 软件 项 目 ， 当 每 个 任务 的 工作 制品 〈 如 规约 、 源 代码 、 测 试用 例 集合 等 ) 作为 质 
量 保证 活动 的 一 部 分 而 被 批准 〈 通 过 正式 的 技术 评审 ) 时 ， 对 其 进展 进行 跟踪 ， 并 对 软件 过 程 
和 项 目 进 行 测量 。 

4) 做 出 明智 的 决策 

在 本 质 上 , 项 目 管理 者 和 软件 小 组 的 决策 应 该 “保持 其 简单 ”。 只 要 有 可 能 ， 就 使 用 商用 成 
品 软件 或 现 有 的 软件 构件 或 模式 ， 可 以 采用 标准 方法 时 避免 定制 接口 ， 识 别 并 避免 显而易见 的 
风险 ， 以 及 分 配 比 你 认为 的 时 间 更 多 的 时 间 来 完成 复杂 或 有 风险 的 任务 。 

5) 进行 事后 分 析 

建立 统一 的 机 制 ， 从 每 个 项 目 中 获取 可 学 习 的 经 验 。 评 估计 划 的 进度 和 实际 的 进度 ， 收 集 
和 分 析 软 件 项 目 度量 数据 ， 从 团队 成 员 和 客户 处 获取 反馈 ， 并 记录 所 有 的 发 现 。 
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5.7.2 软件 项 目 估 算 


软件 项 目 估 算 涉及 人 、 技 术 、 环 境 等 多 种 因素 ， 因 此 很 难 在 项 目 完成 前 准确 地 估算 出 开发 
软件 所 需 的 成 本 、 持 续 时 间 和 工作 量 。 因 此 ， 需 要 一 些 方法 和 技术 来 支持 项 目的 估算 ， 常 用 的 
估算 方法 有 下 列 3 种 。 

(1) 基于 已 经 完成 的 类 似 项 目 进行 估算 。 这 是 一 种 常用 的 也 是 有 效 的 估算 方法 。 

(2) 基于 分 解 技术 进行 估算 。 分 解 技术 包括 问题 分 解 和 过 程 分 解 。 问 题 分 解 是 将 一 个 复杂 
问题 分 解 成 若干 个 小 问题 ， 通 过 对 小 问题 的 估算 得 到 复杂 问题 的 估算 。 过 程 分 解 是 指 先 根据 软 
件 开发 过 程 中 的 活动 〈 分 析 、 设 计 、 编 码 、 测 试 等 ) 进行 估算 ， 然 后 得 到 整个 项 目的 估算 值 。 

(3) 基于 经 验 估算 模型 的 估算 。 和 典型 的 经 验 估算 模型 有 IBM 估算 模型 、CoCoMo 模型 和 
Putnam 模型 。 

上 述 方法 可 以 组 合 使 用 ， 以 提高 估算 的 精度 。 


1. 成 本 估算 方法 


1) 自 项 向 下 估算 方法 

估算 人 员 参 照 以 前 完成 的 项 目 所 耗费 的 总 成 本 (或 总 工作 量 ) 来 推算 将 要 开发 的 软件 的 总 
成 本 (或 总 工作 量 )， 然 后 把 它们 按 阶段 、 步 又 和 工作 单元 进行 分 配 ， 这 种 方法 称 为 自 项 向 下 
估算 方法 。 

自 项 向 下 估算 方法 的 主要 优点 是 对 系统 级 工作 的 重视 ， 所 以 估算 中 不 会 遗漏 诸如 集成 、 配 
置 管理 之 类 的 系统 级 事务 的 成 本 估算 ， 且 估算 工作 量 小 、 速 度 快 。 它 的 缺点 是 往往 不 清楚 低级 
别 上 的 技术 性 困难 问题 ， 而 这 些 困 难 将 会 使 成 本 上 升 。 

2) 自 底 向 上 估算 方法 

自 底 向 上 估算 方法 是 将 待 开发 的 软件 细 分 ， 分 别 估算 每 一 个 子 任务 所 需要 的 开发 工作 量 ， 
然后 将 它们 加 起 来 ， 得 到 软件 的 总 开发 量 。 这 种 方法 的 优点 是 将 每 一 部 分 的 估算 工作 交 给 负责 
该 部 分 工作 的 人 来 做 ， 所 以 估算 较为 准确 。 其 缺点 是 估算 往往 缺少 各 项 子 任务 之 间 相 互联 系 所 
需要 的 工作 量 和 与 软件 开发 有 关 的 系统 级 工作 量 ， 所 以 估算 往往 偏 低 。 

3) 差别 估算 方法 

差别 估算 方法 的 思想 是 将 待 开发 项 目 与 一 个 或 多 个 已 完成 的 类 似 项 目 进行 比较 ， 找 出 与 某 
个 相似 项 目的 若干 不 同 之 处 ， 并 估算 每 个 不 同 之 处 对 成 本 的 影响 ， 导 出 待 开发 项 目的 总 成 本 。 
该 方法 的 优点 是 可 以 提高 估算 的 准确 度 ， 缺 点 是 不 容易 明确 “差别 ”的 界限 。 

4) 其 他 估算 方法 

除了 以 上 方法 之 外 ， 还 有 专家 估算 法 、 类 推 估算 法 和 算式 估算 法 等 。 

(1) 专家 估算 法 。 该 方法 依靠 一 个 或 多 个 专家 对 要 求 的 项 目 做 出 估算 ， 其 精确 性 取决 于 专 
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家 对 估算 项 目的 定性 参数 的 了 解 和 他 们 的 经 验 。 

(2) 类 推 估算 法 。 在 自 项 向 下 的 方法 中 ， 它 是 将 估算 项 目的 总 体 参 数 与 类 似 项 目 进行 直接 
比较 得 到 结果 ; 在 自 底 向 上 方法 中 ， 类 推 是 在 两 个 具有 相似 条 件 的 工作 单元 之 间 进 行 。 

(3) 算式 估算 法 。 专 家 估算 法 和 类 推 估算 法 的 缺点 在 于 它们 依靠 带 有 一 定 盲目 性 和 主观 性 
的 猜测 对 项 目 进行 估算 。 算 式 估算 法 则 是 企图 避免 主观 因素 的 影响 ， 用 于 估算 的 方法 有 两 种 基 
本 类 型 : 由 理论 导出 和 由 经 验 导 出 。 

2. COCOMO 估算 模型 


COCOMO 模型 是 一 种 精确 的 、 易 于 使 用 的 成 本 估算 模型 。 COCOMO 模型 按 其 详细 程度 分 
为 基本 COCOMO 模型 、 中 级 COCOMO 模型 和 详细 COCOMO 模型 。 

1) 基本 COCOMO 模型 

基本 COCOMO 模型 是 一 个 静态 单 变量 模型 , 用 于 对 整个 软件 系统 进行 估算 。 其 公式 如 下 : 

E=a(L) 
D=cE’ 

其 中 , 下 表示 工作 量 ， 单 位 是 人 月 ; D 表示 开发 时 间 ， 单 位 是 月 ; 工 是 项 目的 源 代 码 行 估计 值 ， 
不 包括 程序 中 的 注释 及 文档 ， 其 单位 是 千 行 代码 ;a、b、c、4q 是 常数 。 

基本 COCOMO 模型 可 通过 估算 代码 行 的 值 工 ,然后 计算 开发 工作 量 和 开发 时 间 的 估算 值 。 

2) 中 级 COCOMO 模型 

中 级 COCOMO 模型 是 一 个 静态 多 变量 模型 , 它 将 软件 系统 模型 分 为 系统 和 部 件 两 个 层次 ， 
系统 由 部 件 构成 , 它 把 软件 开发 所 需 的 人 力 (成本) 看 作 是 程序 大 小 和 一 系列 “成 本 驱动 属性 ” 
的 函数 。 

中 级 COCOMO 模型 以 基本 COCOMO 模型 为 基础 , 并 考虑 了 15 种 影响 软件 工作 量 的 因素 ， 
通过 工作 量 调节 因子 (EAF) 修正 对 工作 量 的 估算 ， 从 而 使 估算 更 合理 。 其 公式 如 下 : 

E=a(LPEAF 

其 中 , 工 是 软件 产品 的 目标 代码 行 数 ， 单 位 是 千 行 代码 数 ，a、 是 常数 。 

3) 详细 COCOMO 模型 

它 将 软件 系统 模型 分 为 系统 、 子 系统 和 模块 3 个 层次 ， 除 包括 中 级 模型 所 考虑 的 因素 外 ， 
还 考虑 了 在 需求 分 析 、 软 件 设计 等 每 一 步 的 成 本 驱动 属性 的 影响 。 


3. COCOMOII 模型 
最 初 的 COCOMO 模型 是 得 到 产业 界 最 广泛 应 用 和 讨论 的 软件 成 本 估算 模型 之 一 ， 现 在 它 


已 经 演化 成 更 全 面 的 估算 模型 ， 称 为 COCOMOII。 和 其 前 身 一 样 ，COCOMOII 也 是 一 种 层次 
结构 的 估算 模型 ， 被 分 为 3 个 阶段 性 模型 。 
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(1) 应 用 组 装 模 型 。 在 软件 工程 的 前 期 阶段 使 用 ， 这 时 用 户 界 面 的 原型 开发 、 对 软件 和 系 
统 交 互 的 考虑 、 性 能 的 评估 以 及 技术 成 熟 度 的 评价 是 最 重要 的 。 

(2) 早期 设计 阶段 模型 。 在 需求 已 经 稳定 并 且 基本 的 软件 体系 结构 已 经 建立 时 使 用 。 

(3) 体系 结构 阶段 模型 。 在 软件 的 构造 过 程 中 使 用 。 

和 所 有 的 软件 估算 模型 一 样 , COCOMOII 模型 也 需要 使 用 规模 估算 信息 ,在 模型 层次 结构 
中 有 3 种 不 同 的 规模 估算 选择 :对象 点 、 功 能 点 和 代码 行 。 应 用 组 装 模 型 使 用 的 是 对 象 点 ， 早 
期 设计 阶段 模型 使 用 的 是 功能 点 ， 功 能 点 可 以 转换 为 代码 行 。 

对 象 点 也 是 一 种 间接 的 软件 测量 。 计 算 对 象 点 时 使 用 如 下 的 计数 值 :〈 用 户 界 面 的 ) 屏幕 
书 ， 报 表 数 ， 构 造 应 用 系统 可 能 需要 的 构件 数 。 


4. Putnam 估算 模型 
Putnam 模型 是 一 种 动态 多 变量 模型 , 它 是 假设 在 软件 开发 的 整个 生存 周期 中 工作 量 有 特定 
的 分 布 。 


根据 一 些 大 型 软件 项 目 (30 人 年 以 上 ) 的 工作 量 分 布 情况 ， 推 导出 软件 项 目 在 软件 生存 周 
期 各 阶段 的 工作 量 分 布 。 根 据 该 曲线 给 出 代码 行 数 、 工 作 量 和 开发 时 间 之 间 的 关系 ,如 下 所 示 : 
天 三 区 人 
其 中 , 工 表 示 源 程序 代码 行 数 (LOC); 
恕 表示 开发 持续 时 间 (年 ); 
E 是 包括 软件 开发 和 维护 在 整个 生存 期 所 花费 的 工作 量 ( 人 年 ); 
CG 表示 技术 状态 常数 ， 其 值 依赖 于 开发 环境 ， 如 表 5-1 所 示 。 


表 5-1 技术 状态 常数 Ci 的 取 值 

开发 环境 举例 
没有 软件 开发 方法 学 的 支持 ， 缺 少 文档 和 评审 ， 采 用 批 处 理 方式 
有 软件 开发 方法 学 的 支持 ， 有 适宜 的 文档 和 评审 ， 采 用 交互 式 处 理 方式 
采用 CASE 工具 和 集成 化 CASE 环境 


5.7.3 ”进度 管理 


软件 项 目 进度 管理 的 目的 是 确保 软件 项 目 在 规定 的 时 间 内 按期 完成 。 一 个 软件 项 目 通常 可 
以 分 成 多 个 子 项 目 和 任务 ， 这 些 任务 之 间 存 在 一 定 的 关系 。 有 些 任 务 可 并 行 开 发 ， 有 些 任务 必 
须 在 另 一 些 任务 完成 后 才能 进行 。 完 成 每 个 任务 都 需要 一 定 的 资源 ， 包 括 人 、 时 间 等 ， 项 目 管 
理 者 的 任务 就 是 定义 所 有 的 项 目 任务 以 及 它们 之 间 的 依赖 关系 ， 制 订 项 目的 进度 安排 ， 规 划 每 
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个 任务 所 需 的 工作 量 和 持续 时 间 ， 并 在 项 目 开 发 过 程 中 不 断 跟踪 项 目的 执行 情况 ， 发 现 那些 未 
按 计划 进度 完成 的 任务 对 整个 项 目 工期 的 影响 ， 并 及 时 进行 调整 。 

软件 开发 项 目的 进度 安排 有 如 下 两 种 方式 : 系统 最 终 交 付 日 期 已 经 确定 ， 软 件 开发 部 门 必 
须 在 规定 期 限 内 完成 ， 系 统 最 终 交付 日 期 只 确定 了 大 致 的 年 限 ， 最 后 交付 日 期 由 软件 开发 部 门 
确定 。 


1. 进度 管理 的 基本 原则 


指导 软件 进度 安排 的 基本 原则 如 下 。 

(1) 划分 。 项 目 必 须 被 划分 成 若干 可 以 管理 的 活动 和 任务 。 为 了 实现 项 目的 划分 ， 对 于 产 
品 和 过 程 都 需要 进行 分 解 。 

(2) 相互 依赖 性 。 划 分 后 的 各 个 活动 或 任务 之 间 的 相互 依赖 关系 必须 是 明确 的 。 有 些 任务 
必须 按 顺 序 出 现 ， 而 有 些 任务 则 可 以 并 发 进行 。 有些 活 动 只 有 在 其 他 活动 产生 的 工作 产品 完成 
后 才能 够 开始 ， 而 有 些 则 可 以 独立 进行 。 

(3) 时 间 分 配 。 必须 为 每 个 被 调度 的 任务 分 配 一 定数 量 的 工作 单位 (如 若干 人 天 的 工作 量 )。 
此 外 ， 必 须 为 每 个 任务 制定 开始 和 结束 日 期 。 任 务 的 开始 日 期 和 结束 日 期 取决 于 任务 之 间 的 相 
互 依赖 性 以 及 工作 方式 。 

(4) 工作 量 确认 。 每 个 项 目 都 有 预定 数量 的 人 员 参 与 。 在 进行 时 间 分 配 时 ， 项 目 管理 者 必 
须 确保 在 任意 时 段 中 分 配 的 人 员 数 量 不 会 超过 项 目 团队 中 的 总 人 数 。 

(5) 确定 责任 。 安 排 了 进度 计划 的 每 个 任务 都 应 该 指定 特定 的 团队 成 员 来 负责 。 

(6) 明确 输出 结果 。 安 排 了 进度 计划 的 每 个 任务 都 应 该 有 一 个 明确 的 输出 结果 。 对 于 软件 
项 目 而 言 ， 输 出 结果 通常 是 一 个 工作 产品 〈 例 如 一 个 模块 的 设计 ) 或 某 个 工作 产品 的 一 部 分 。 
通常 ， 可 以 将 多 个 工作 产品 组 合成 可 交付 产品 。 

(7) 确定 里 程 碑 。 每 个 任务 或 任务 组 都 应 该 与 一 个 项 目 里 程 碑 相关 联 。 当 一 个 或 多 个 工作 
产品 经 过 质量 评审 并 且 得 到 认可 时 ， 标 志 着 一 个 里 程 碑 的 完成 。 


2. 进度 安排 


为 监控 软件 项 目的 进度 计划 和 工作 的 实际 进展 情况 , 表示 各 项 任务 之 间 进度 的 相互 依赖 关 
系 ， 需 要 采用 图 示 的 方法 。 在 图 中 明确 标明 如 下 内 容 。 

(1) 各 个 任务 的 计划 开始 时 间 和 完成 时 间 。 

(2) 各 个 任务 的 完成 标志 。 

(3) 各 个 任务 与 参与 工作 的 人 数 ， 各 个 任务 与 工作 量 之 间 的 衔接 情况 。 
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(4) 完成 各 个 任务 所 需 的 物理 资源 和 数据 资源 。 

进度 安排 的 常用 图 形 描述 方法 有 Gantt 图 ( 甘 特 图 ) 和 项 目 计 划 评 审 技术 (Program Evaluation & 
Review Technique，PERT) 图 。 

1) Gantt 图 

Gantt 图 是 一 种 简单 的 水 平 条 形 图 , 它 以 日 历 为 基准 描述 项 目 任务 。 水 平 轴 表 示 日 历时 间 线 
(如 时 、 天 、 周 、 月 和 年 等 )， 每 个 条 形 表示 一 个 任务 ， 任 务 名 称 垂直 地 列 在 左边 的 列 中 ， 图 中 
水 平 条 的 起 点 和 终点 对 应 水 平 轴 上 的 时 间 ， 分 别 表示 该 任务 的 开始 时 间 和 结束 时 间 ， 水 平 条 的 
长 度 表 示 完 成 该 任务 所 持续 的 时 间 。 当 日 历 中 同一 时 段 存 在 多 个 水 平 条 时 ， 表 示 任 务 之 间 的 并 
发 。 图 5-12 所 示 的 Gantt 图 描述 了 3 个 任务 的 进度 安排 。 任 务 1 首先 开始 ， 完 成 它 需 要 6 个 月 
时 间 ; 任务 2 在 1 个 月 后 开始 ， 完 成 它 需要 9 个 月 时 间 ; 任务 3 在 6 个 月 后 开始 ， 完 成 它 需要 
5 个 月 时 间 。 


时 间 2008 年 
任务 1 月 | 上 2 月 | 上 3 月 | 4 月 |5 月 |6 月 |7 月 | 8 月 | 9 月 | 10 月 | 11 月 | 12 月 
任务 1 | 二 | 
任务 2 
EE = 
司 例 已 完成 的 任务 才 天 
未 完成 的 任务 
图 5-12 ”Gantt 图 实例 
Gantt 图 能 清晰 地 描述 每 个 任务 从 何 时 开始 ,到 何 时 结束 , 任务 的 进展 情况 以 及 各 个 任务 之 


间 的 并 行 性 。 但 是 它 不 能 清晰 地 反映 出 各 任务 之 间 的 依赖 关系 , 难以 确定 整个 项 目的 关键 所 在 ， 
也 不 能 反映 计划 中 有 潜力 的 部 分 。 

2) PERT 图 

了 PERT 图 是 一 个 有 向 图 ， 图 中 的 箭头 表示 任务 ， 它 可 以 标 上 完成 该 任务 所 需 的 时 间 。 图 中 
的 结 点 表示 流入 结 点 的 任务 的 结束 ， 并 开始 流出 结 点 的 任务 ， 这 里 把 结 点 称 为 事件 。 只 有 当 流 
入 该 结 点 的 所 有 任务 都 结束 时 ， 结 点 所 表示 的 事件 才 出 现 ， 流 出 结 点 的 任务 才 可 以 开始 。 事 件 
本 身 不 消耗 时 间 和 资源 ， 它 仅 表示 某 个 时 间 点 。 一 个 事件 有 一 个 事件 号 和 出 现 该 事件 的 最 早 时 
刻 和 最 迟 时 刻 。 最 早 时 刻 表 示 在 此 时 刻 之 前 从 该 事件 出 发 的 任务 不 可 能 开始 ;最 迟 时 刻 表 示 从 
该 事件 出 发 的 任务 必须 在 此 时 刻 之 前 开始 ， 否 则 整个 工程 就 不 能 如 期 完成 。 每 个 任务 还 可 以 有 
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一 个 松弛 时 间 (Slack Time)， 表 示 在 不 影响 整个 工期 的 前 提 下 完成 该 任务 有 多 少 机 动 余地 。 为 
了 表示 任务 间 的 关系 ， 在 图 中 还 可 以 加 入 一 些 空 任务 〈 用 虚线 箭头 表示 )， 完 成 空 任务 的 时 间 
为 0。 
图 5-13 是 PERT 图 的 一 个 实例 。 不 难看 出 ， 该 图 中 松弛 时 间 为 0 的 这 些 任务 是 完成 整个 工 
程 的 关键 路 径 ， 其 事件 流 为 1 一 2 一 3 一 4 一 6 一 8 一 10 一 11。 
事件 号 ”最早 时 刻 


任务 持续 时 间 
(松弛 时 间 


图 5-13 PERT 图 实例 


PERT 图 不 仅 给 出 了 每 个 任务 的 开始 时 间 、 结 束 时 间 和 完成 该 任务 所 需 的 时 间 ， 还 给 出 了 
任务 之 间 的 关系 ， 即 哪些 任务 完成 后 才能 开始 另外 一 些 任务 ， 以 及 如 期 完成 整个 工程 的 关键 路 
径 。 图 中 的 松弛 时 间 则 反映 了 完成 某 些 任务 时 可 以 推迟 其 开始 时 间或 延长 其 所 需 完成 的 时 间 。 
但 是 ，PERT 图 不 能 反映 任务 之 间 的 并 行 关系 。 


5.7.4 ”软件 项 目的 组 织 


开发 组 织 采用 什么 形式 组 织 ， 不 仅 要 考虑 软件 项 目的 特点 ， 还 需要 考虑 参与 人 员 的 素质 。 
在 软件 项 目 组 织 中 ， 其 组 织 原则 有 以 下 3 条 。 

(1) 尽早 落实 责任 。 在 软件 项 目 开 始 组 织 时 ， 要 尽早 指定 专人 负责 ， 使 他 有 权 进 行 管理 ， 
并 对 任务 的 完成 负 全 责 。 

(2) 减少 交流 接口 。 一 个 组 织 的 生产 率 随 着 完成 任务 时 存在 的 通信 路 径 数 目的 增加 而 降 
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低 。 要 有 合理 的 人 员 分 工 、 好 的 组 织 结构 、 有 效 的 通信 ， 减 少 不 必 要 的 生产 率 的 损失 。 
(3) 责 权 均衡 。 软 件 管理 人 员 承 担 的 责任 不 应 比 赋予 他 的 权利 还 大 。 


1. 组 织 结构 的 模式 


根据 项 目的 分 解 和 过 程 的 分 解 ， 软 件 项 目 可 以 有 以 下 多 种 组 织 形式 。 

1) 按 项 目 划分 的 模式 

按 项 目 将 开发 人 员 组 织 成 项 目 组 ， 项 目 组 的 成 员 共 同 完成 该 项 目的 所 有 开发 任务 ， 包 括 项 
目的 定义 、 需 求 分 析 、 设 计 、 编 码 、 测 试 、 评 审 以 及 所 有 的 文档 编制 ， 甚 至 包括 该 项 目的 维护 。 

2) 按 职 能 划分 的 模式 

按 软件 过 程 中 所 反映 的 各 种 职能 将 项 目的 参与 者 组 织 成 相应 的 专业 组 ， 如 开发 组 〈 可 进 一 
步 分 为 需求 分 析 组 、 设 计 组 、 编 码 组 )、 测 试 组 、 质 量 保证 组 、 维 护 组 等 。 

3) 矩阵 模式 

这 种 模式 是 上 述 两 种 模式 的 组 合 ， 它 既 按 职 能 组 织 相应 的 专业 组 ， 又 按 项 目 组 织 项 目 组 。 
每 个 软件 人 员 既 属于 某 个 专业 组 ， 又 属于 某 个 项 目 组 。 每 个 软件 项 目 指定 一 个 项 目 经 理 ， 项 目 
中 的 成 员 根 据 其 所 属 的 专业 组 的 职能 承担 项 目的 相应 任务 。 


2. 程序 设计 小 组 的 组 织 方式 


这 里 的 程序 设计 小 组 主要 是 指 从 事 软件 开发 活动 的 小 组 ， 有 以 下 3 种 不 同 的 组 织 形 式 。 

1) 主 程序 员 制 小 组 

主 程序 员 制 小 组 由 一 名 主 程序 员 、 若 干 名 程序 员 、 一 名 后 援 工程 师 和 一 名 资料 员 组 成 。 主 
程序 员 通 常 由 高 级 工程 师 担 任 ， 负 责 小 组 的 全 部 技术 活动 ， 进 行 任务 的 分 配 ， 协 调 技 术 问 题 ， 
组 织 评审 ， 必 要 时 也 设计 和 实现 项 目 中 的 关键 部 分 。 程 序 员 负责 完成 主 程序 员 指 派 的 任务 ， 包 
括 相 关 文 档 的 编写 。 后 援 工程 师 协助 主 程序 员工 作 ， 必 要 时 能 替代 主 程序 员 ， 也 做 部 分 开发 工 
作 。 资 料 员 负 责 小 组 中 所 有 文档 资料 的 管理 ， 收 集 与 过 程度 量 相关 的 数据 ， 为 评审 准备 资料 。 
一 个 资料 员 可 以 同时 服务 于 多 个 小 组 。 

主 程序 员 制 小 组 突出 了 主 程序 员 的 领导 作用 ， 小 组 内 的 通信 主要 体现 在 主 程序 员 与 程序 员 
之 间 。 

2) 民主 制 小 组 

民主 制 小 组 成 员 之 间 地 位 平等 ， 虽 然 形式 上 有 一 位 组 长 ， 但 小 组 的 工作 目标 和 决策 都 是 由 
全 体 成 员 决定 的 ， 互 相合 作 ， 形 成 一 个 良好 的 工作 氛围 。 另 外 ， 这 种 形式 的 组 内 通信 路 径 较 多 。 

3) 层次 式 小 组 

层次 式 小 组 的 组 织 形 式 是 一 名 组 长 领导 若干 名 高 级 程序 员 ， 每 名 高 级 程序 员 领导 若干 名 程 
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序 员 。 组 长 通常 就 是 项 目 负责 人 ， 负 责 全 组 的 技术 工作 ， 进 行 任务 分 配 ， 组 织 评审 。 高 级 程序 
员 负 责 项 目的 一 个 部 分 或 一 个 子 系统 ， 负 责 该 部 分 的 分 析 、 设 计 ， 并 将 子 任务 分 配给 程序 员 。 
这 种 组 织 形式 适合 于 具有 层次 结构 特征 的 项 目的 开发 。 其 组 内 的 通信 路 径 数 介 于 主 程序 员 制 小 
组 和 民主 制 小 组 之 间 。 
5.7.5 ”软件 配置 管理 

在 软件 开发 过 程 中 变更 是 不 可 避免 的 ， 而 变更 时 由 于 没有 进行 变更 控制 ， 可 能 加 剧 了 项 目 
中 的 混乱 ， 为 了 协调 软件 开发 使 得 混乱 减 到 最 小 ， 使 用 配置 管理 技术 ， 使 变更 所 产生 的 错误 达 
到 最 小 并 最 有 效 地 提高 生产 率 。 

软件 配置 管理 (Software Configure Management，SCM) 用 于 整个 软件 工程 过 程 。 其 主要 
目标 是 标识 变更 ; 控制 变更 ; 确保 变更 正确 地 实现 报告 有 关 变 更 。SCM 是 一 组 管理 整个 软件 
生存 周期 中 各 阶段 变更 的 活动 。 


1. 基线 


基线 是 软件 生存 周期 中 各 开发 阶段 的 一 个 特定 点 ， 它 的 作用 是 使 各 开发 阶段 的 工作 划分 更 
加 明确 ， 使 本 来 连续 的 工作 在 这 些 点 上 断 开 ， 以 便于 检查 与 肯定 阶段 成 果 。 因 此 ， 基 线 可 以 作 
为 一 个 检查 点 ， 在 开发 过 程 中 ， 当 采用 的 基线 发 生 错误 时 可 以 知道 所 处 的 位 置 ， 返 回 到 最 近 和 
最 恰当 的 基线 上 。 


2. 软件 配置 项 


软件 配置 项 (Software Configure Item，SCI) 是 软件 工程 中 产生 的 信息 项 ， 它 是 配置 管理 
的 基本 单位 ， 对 于 已 经 成 为 基线 的 SCI， 虽 然 可 以 修改 ， 但 必须 按照 一 个 特殊 的 、 正 式 的 过 程 
进行 评估 ， 确 认 每 一 处 修改 。 以 下 的 SCI 是 SCM 的 对 象 ， 并 可 形成 基线 。 

(1) 系统 规格 说 明 书 。 

(2) 软件 项 目 实施 计划 。 

(3) 软件 需求 规格 说 明 书 。 

(4) 设计 规格 说 明 书 (数据 设 计 、 体 系 结构 设计 、 模 块 设计 、 接 口 设计 、 对 象 描述 (使 用 
面向 对 象 技术 时 ))。 

(5) 源 代码 清单 。 

(6) 测试 计划 和 过 程 、 测 试用 例 和 测试 结果 记录 。 

(7) 操作 和 安装 手册 。 

(8) 可 执行 程序 〈 可 执行 程序 模块 、 连 接 模块 )。 

(9) 数据 库 描述 《模式 和 文件 结果 、 初 始 内 容 )。 
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(10) 用 户 手册 。 

(11) 维护 文档 (软件 问题 报告 、 维 护 请 求 、 工 程 变更 次 序 )。 

(12) 软件 工程 标准 。 

(13) 项 目 开发 小 结 。 

此 外 , 许多 软件 工程 组 织 把 配置 控制 之 下 的 软件 工具 , 即 编辑 程序 、 编译 程序 、 其 他 CASE 
工具 的 特定 版 本 都 作为 软件 配置 的 一 部 分 列 入 其 中 。 


3. 版 本 控制 


软件 配置 实际 上 是 一 个 动态 的 概念 ， 它 一 方面 随 着 软件 生存 周期 向 前 推进 ，SCI 的 数量 在 
不 断 增多 ， 一 些 文档 经 过 转换 生成 另 一 些 文档 ， 并 产生 一 些 信息 ; 另 一 方面 又 随时 会 有 新 的 变 
更 出 现 ， 形 成 新 的 版 本 。 

可 以 采用 图 5-14 所 示 的 演变 图 来 表达 系统 的 不 同 版 本 , 在 图 中 各 个 结 点 是 一 个 完全 的 软件 
版 本 。 软 件 的 每 一 个 版 本 都 是 SCI 〈 源 代码 、 文 档 、 数 据 ) 的 一 个 汇集 ， 而 且 各 个 版 本 都 可 能 
由 不 同 的 变种 组 成 。 


图 5-14 版 本 演变 


4. 变更 控制 


软件 工程 过 程 中 某 一 阶段 的 变更 均 要 引起 软件 配置 的 变更 ， 这 种 变更 必须 严格 地 加 以 控制 
和 管理 ， 保 持 修改 信息 ， 并 把 精确 、 清 晰 的 信息 传递 到 软件 工程 过 程 的 下 一 步骤 。 

对 于 一 个 大 型 软件 来 说 ， 不 加 控制 的 变更 很 快 就 会 引起 混乱 。 因 此 ， 变 更 控制 是 一 项 最 重 
要 的 软件 配置 任务 。 为 了 有 效 地 实现 变更 控制 ， 需 借助 于 配置 数据 库 和 基线 的 概念 。 
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配置 数据 库 可 以 分 为 以 下 三 类 。 

(1) 开发 库 。 专 供 开发 人 员 使 用 ， 其 中 的 信息 可 能 做 频繁 修改 ， 对 其 控制 相当 宽松 。 

(2) 受 控 库 。 在 生存 期 某 一 阶段 工作 结束 时 发 布 的 阶段 产品 ， 这 些 是 与 软件 开发 工作 相关 
的 计算 机 可 读 信息 和 人 工 可 读 信息 。 软 件 配置 管理 正 是 对 受 控 库 中 的 各 个 软件 项 进行 管理 ， 受 
控 库 也 称 为 软件 配置 库 。 

(3) 产品 库 。 在 开发 的 软件 产品 完成 系统 测试 后 ， 作 为 最 终 产品 存 入 产品 库 ， 等 待 交付 用 
户 或 现场 安装 。 


5.7.6 ”风险 管理 


一 般 认为 软件 风险 包含 两 个 特性 : 不 确定 性 和 损失 。 不 确定 性 是 指 风险 可 能 发 生 也 可 能 不 
发 生 ， 损 失 是 指 如 果 风 险 发 生 ， 就 会 产生 恶性 后 果 。 在 进行 风险 分 析 时 ， 重 要 的 是 量化 每 个 风 
险 的 不 确定 程度 和 损失 程度 。 为 了 实现 这 一 点 ， 必 须 考 虑 不 同类 型 的 风险 。 

项 目 风险 威胁 到 项 目 计划 。 也 就 是 说 ， 如 果 项 目 风险 发 生 ， 就 有 可 能 拖延 项 目的 进度 和 增 
加 项 目的 成 本 。 项 目 风险 是 指 预算 、 进 度 、 人 员 “〔〈 聘 用 职员 及 组 织 )、 资 源 、 利 益 相关 者 、 需 
求 等 方面 的 潜在 问题 以 及 它们 对 软件 项 目的 影响 。 项 目 复杂 度 、 规 模 及 结构 不 确定 性 也 属于 项 
目 风险 因素 。 

技术 风险 威胁 到 要 开发 软件 的 质量 及 交付 时 间 。 如 果 技 术 风 险 发 生 ， 开 发 工作 就 可 能 变 得 
很 困难 或 根本 不 可 能 。 技 术 风 险 是 指 设计 、 实 现 、 接 口 、 验 证 和 维护 等 方面 的 潜在 问题 。 此 外 ， 
规格 说 明 的 歧义 性 、 技 术 的 不 确定 性 、 技 术 陈旧 以 及 “前 沿 ” 技 术 也 是 技术 风险 因素 。 技 术 风 
险 的 发 生 是 因为 问题 比 我 们 所 设想 的 更 加 难以 解决 。 

商业 风险 威胁 到 要 开发 软件 的 生存 能 力 ， 且 常常 会 危害 到 项 目 或 产品 。5 个 主要 的 商业 风 
险 如 下 。 

(1) 市 场 风险 。 开 发 了 一 个 没有 人 真正 需要 的 优良 产品 或 系统 。 

(2) 策略 风险 。 开 发 的 产品 不 再 符合 公司 的 整体 商业 策略 。 

(3) 销售 风险 。 开 发 了 一 个 销售 部 门 不 知道 如 何 去 销 售 的 产品 。 

(4) 管理 风险 。 由 于 重点 的 转移 或 人 员 的 变动 而 失去 了 高 级 管理 层 的 支持 。 

(5) 预算 风险 。 没 有 得 到 预算 或 人 员 的 保证 。 

另 一 种 常用 的 风险 分 类 方式 是 由 Charette 提出 的 。 已 知 风险 是 通过 仔细 评估 项 目 计划 、 开 
发 项 目的 商业 和 技术 环境 以 及 其 他 可 靠 的 信息 来 源 〈 如 不 现实 的 交付 时 间 、 没 有 文档 化 需求 或 
文档 化 软件 范围 、 恶 劣 的 开发 环境 ) 之 后 可 以 发 现 的 那些 风险 。 可 预测 风险 能 够 从 过 去 项 目的 
经 验 中 推断 出 来 (如 人 员 变 动 、 与 客户 缺乏 沟通 、 由 于 正在 进行 维护 而 使 开发 人 员 精 力 分 散 )。 
不 可 预测 风险 可 能 会 真 的 出 现 ， 但 很 难事 先 识别 。 


1. 风险 识别 
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风险 识别 试图 系统 化 地 指出 对 项 目 计划 估算 、 进 度 、 资 源 分 配 等 ) 的 威胁 。 识 别 出 已 知 
风险 和 可 预测 风险 后 ， 项 目 管理 者 首先 要 做 的 是 在 可 能 时 回避 这 些 风险 ， 在 必要 时 控制 这 些 


风险 。 


识别 风险 的 一 种 方法 是 建立 风险 条 目 检查 表 。 该 检查 表 可 用 于 风险 识别 ， 并 且 主 要 用 来 识 
别 下 列 几 种 类 型 中 的 一 些 已 知 风险 和 可 预测 风险 。 


(1) 产品 规模 。 
(2) 商业 影响 。 
(3) 客户 特性 。 
(4) 过 程 定义 。 
(5) 开发 环境 。 
(6) 开发 技术 。 


与 要 开发 或 要 修改 的 软件 的 总 体 规模 相关 的 风险 。 

与 管理 者 或 市 场所 施加 的 约束 相关 的 风险 。 

与 客户 的 素质 以 及 开发 者 和 客户 定期 沟通 的 能 力 相 关 的 风险 。 

与 软件 过 程 定义 的 程度 以 及 该 过 程 被 开发 组 织 遵守 的 程度 相关 的 风险 。 
与 用 来 开发 产品 的 工具 的 可 得 性 及 质量 相关 的 风险 。 

与 待 开发 软件 的 复杂 性 及 系统 所 包含 技术 的 “新 奇 性 ”相关 的 风险 。 


(7) 人 员 才 干 及 经 验 。 与 软件 工程 师 的 总 体 技术 水 平 及 项 目 经 验 相关 的 风险 。 
风险 条 目 检 查 表 可 以 采用 不 同 的 方式 来 组 织 。 与 上 述 每 个 主题 相关 的 问题 可 以 针对 每 一 个 
软件 项 目 来 回答 。 根 据 这 些 问 题 的 答案 ， 项 目 管理 者 就 可 以 估计 风险 产生 的 影响 。 
当然 ， 也 可 以 采用 另 一 种 风险 条 目 检 查 表格 式 ， 即 仅仅 列 出 与 每 一 种 类 型 有 关 的 特性 ， 最 
终 给 出 一 组 风险 因素 和 驱动 因子 以 及 它们 发 生 的 概率 。 风险 因素 包括 性 能 、 成 本 、 支 持 和 进度 。 
风险 因素 是 以 如 下 方式 定义 的 。 
(1) 性 能 风险 。 产 品 能 够 满足 需求 且 符 合 其 使 用 目的 的 不 确定 程度 。 
(2) 成 本 风险 。 能 够 维持 项 目 预算 的 不 确定 程度 。 
(3) 支持 风险 。 开 发 出 的 软件 易于 纠 错 、 修 改 及 升级 的 不 确定 程度 。 
(4) 进度 风险 。 能 够 维持 项 目 进度 且 按 时 交付 产品 的 不 确定 程度 。 


2. 风险 预测 


风险 预测 又 称 风险 估计 ， 它 试图 从 两 个 方面 评估 一 个 风险 : 风险 发 生 的 可 能 性 或 概率 ， 如 
果 风 险 发 生 了 所 产生 的 后 果 。 

1) 风险 预测 活动 

通常 ， 项 目 计 划 人 员 与 管理 人 员 、 技 术 人 员 一 起 进行 以 下 4 步 风 险 预测 活动 。 

(1) 建立 一 个 尺度 或 标准 ， 以 反映 风险 发 生 的 可 能 性 。 

(2) 描述 风险 产生 的 后 果 。 
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(3) 估算 风险 对 项 目 和 产品 的 影响 。 

(4) 标注 风险 预测 的 整体 精确 度 ， 以 免 产 生 误解 。 

一 种 简单 的 风险 预测 技术 是 建立 风险 表 。 风 险 表 的 第 1 列 列 出 所 有 的 风险 (由 风险 识别 活 
动 得 到 )， 第 2 一 4 列 列 出 每 个 风险 的 种 类 、 发 生 的 概率 以 及 所 产生 的 影响 。 风 险 所 产生 的 影响 
可 用 一 个 数字 来 表示 :“1” 表 示 灾 难 性 的 ;“2” 表 示 严 重 的 ;“3 ”表示 轻微 的 ;“4” 表 示 可 忽 
略 的 。 

2) 评估 风险 影响 

如 果 风 险 真 的 发 生 ， 有 3 个 因素 可 能 会 影响 风险 所 产生 的 后 果 ， 即 风险 的 本 质 、 范 围 和 时 
间 。 风 险 的 本 质 是 指 当 风险 发 生 时 可 能 带 来 的 问题 。 例 如 ， 一 个 定义 很 差 的 与 客户 硬件 的 外 部 
接口 〈 技 术 风险 ) 会 妨碍 早期 的 设计 和 测试 ， 也 有 可 能 导致 项 目 后 期 阶段 的 系统 集成 问题 。 风 
险 的 范围 包括 风险 的 严重 性 〈 即 风险 有 多 严重 ) 及 风险 的 整体 分 布 情况 〈 即 项 目 中 有 多 少 部 分 
受到 影响 或 有 多 少 客户 受到 损害 )。 风 险 的 时 间 是 指 何 时 能 够 感受 到 风险 的 影响 及 风险 的 影响 
会 持续 多 长 时 间 。 在 大 多 数 情 况 下 ， 项 目 管理 者 希望 “ 坏 消 息 ” 越 早 出 现 越 好 ， 但 在 某 些 情况 
下 则 是 越 迟 越 好 。 

整体 的 风险 显露 度 (Risk Exposure，RE) 可 由 下 面 的 关系 确定 : 

RE=PXC 
其 中 ,，P 是 风险 发 生 的 概率 ，C 是 风险 发 生 时 带 来 的 项 目 成 本 。 
3. 风险 评估 
在 进行 风险 评估 时 ， 建 立 了 如 下 形式 的 三 元 组 : 
(roliaxi) 
其 中 ,表示 风险 ，1; 表 示 风 险 发 生 的 概率 ，x; 表 示 风 险 产生 的 影响 。 

一 种 对 风险 评估 很 有 用 的 技术 就 是 定义 风险 参照 水 准 。 对 于 大 多 数 软件 项 目 来 说 ， 成 本 、 
进度 和 性 能 就 是 3 种 典型 的 风险 参照 水 准 。 也 就 是 说 ,对 于 成 本 超支 、 进 度 延期 、 性 能 降低 (或 
它们 的 某 种 组 合 )， 有 一 个 表明 导致 项 目 终止 的 水 准 。 

在 风险 评估 过 程 中 ， 需 要 执行 以 下 4 个 步骤 。 

(1) 定义 项 目的 风险 参考 水 平 值 。 

(2) 建立 每 一 组 (ri 与 每 一 个 参考 水 平 值 之 间 的 关系 。 

(3) 预测 一 组 临界 点 以 定义 项 目 终止 区 域 ， 该 区 域 由 一 条 曲线 或 不 确定 区 域 所 界定 。 

(4) 预测 什么 样 的 风险 组 合 会 影响 参考 水 平 值 。 
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4. 风险 控制 

风险 控制 的 目的 是 辅助 项 目 组 建立 处 理 风 险 的 策略 。 一 个 有 效 的 策略 必须 考虑 以 下 3 个 
问题 。 

1) 风险 避免 


应 对 风险 的 最 好 办 法 是 主动 地 避免 风险 ， 即 在 风险 发 生前 分 析 引 起 风险 的 原因 ， 然 后 采取 
措施 ， 以 避免 风险 的 发 生 。 

例如 项 目 风险 ;表示 “频繁 的 人 员 流 动 ”， 根据 历史 经 验 可 知 ， 该 风险 发 生 的 概率 1; 大 约 
为 70%， 该 风险 产生 的 影响 x 是 第 2 级 (严重 的 )。 为 了 避免 该 风险 ， 可 以 采取 以 下 策略 。 

(1) 与 现 有 人 员 一 起 探讨 人 员 流动 原因 〈 如 恶劣 的 工作 条 件 、 低 报酬 、 竞 争 激烈 的 劳动 
力 市 场 等 )。 

(2) 在 项 目 开始 之 前 采取 行动 ， 设 法 缓解 那些 能 够 控制 的 起 因 。 

(3) 项 目 启动 之 后 ， 假 设 会 发 生 人 员 流动 ， 当 有 人 员 离 开 时 ， 找 到 能 够 保证 工作 连续 性 
的 方法 。 

(4) 组 织 项 目 团队 ， 使 得 每 一 个 开发 活动 的 信息 都 能 被 广泛 传播 和 交流 。 

(5) 制定 工作 产品 标准 ， 并 建立 相应 机 制 以 确保 能 够 及 时 创建 所 有 的 模型 和 文档 。 

(6) 同等 对 待 所 有 工作 的 评审 。 

(7) 给 每 一 个 关键 的 技术 人 员 都 指定 一 个 后 备 人 员 。 

2) 风险 监控 

项 目 管理 者 应 监控 某 些 因素 ， 这 些 因素 可 以 提供 风险 是 否 正在 变 高 或 变 低 的 指示 。 在 频繁 
的 人 员 流 动 的 例子 中 ， 应 该 监测 团队 成 员 对 项 目 压力 的 普遍 态度 、 团 队 的 凝聚 力 、 团 队 成 员 彼 
此 之 间 的 关系 、 与 报酬 和 利益 相关 的 潜在 问题 、 在 公司 内 及 公司 外 工作 的 可 能 性 。 

3) RMMM 计划 

风险 管理 策略 可 以 包含 在 软件 项 目 计划 中 , 或 者 风险 管理 步骤 也 可 以 组 织 成 一 个 独立 的 风 
险 缓解 、 监 控 和 管理 计划 (RMMM 计划 )。RMMM 计划 将 所 有 风险 分 析 工 作文 档 化 ， 并 由 项 
目 管理 者 作为 整个 项 目 计划 中 的 一 部 分 来 使 用 。 

建立 了 RMMM 计划 ， 而 且 项 目 已 经 启动 之 后 ， 风 险 缓 解 及 监测 步骤 也 就 开始 了 。 风 险 组 
解 是 一 种 问题 规避 活动 ， 而 风险 监测 是 一 种 项 目 跟踪 活动 ， 这 种 监测 活动 有 3 个 主要 目的 : 评 
估 所 预测 的 风险 是 否 真 的 发 生 了 ; 保证 正确 地 实施 了 各 风险 的 缓解 步骤 ， 收集 能 够 用 于 今后 风 
险 缝隙 的 信息 。 在 很 多 情况 下 ， 项 目 中 发 生 的 问题 可 以 追溯 到 不 止 一 个 风险 ， 所 以 风险 监测 的 
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另 一 个 任务 就 是 试图 找到 “起 源 ”( 在 整个 项 目 中 是 哪些 风险 引起 了 哪些 问题 )。 


5.8 软件 质量 


软件 质量 是 指 反 映 软件 系统 或 软件 产品 满足 规定 或 隐 含 需求 的 能 力 的 特征 和 特性 全 体 。 软 
件 质量 管理 是 指 对 软件 开发 过 程 进行 独立 的 检查 活动 ， 由 质量 保证 、 质 量规 划 和 质量 控制 3 个 
主要 活动 构成 。 软 件 质量 保证 是 指 为 保证 软件 系统 或 软件 产品 充分 满足 用 户 要 求 的 质量 而 进行 
的 有 计划 、 有 组 织 的 活动 ， 其 目的 是 生产 高 质量 的 软件 。 


5.8.1 软件 质量 特性 


讨论 软件 质量 首先 要 了 解 软件 的 质量 特性 ， 目 前 已 经 有 多 种 软件 质量 模型 来 描述 软件 质量 
特性 ， 例 如 ISOTEC 9126 软件 质量 模型 和 Mc Call 软件 质量 模型 。 

1) ISO/TEC 9126 软件 质量 模型 

ISO/EC 9126 软件 质量 模型 由 3 个 层次 组 成 : 第 一 层 是 质量 特性 ， 第 二 层 是 质量 子 特性 ， 
第 三 层 是 度量 指标 。 该 模型 的 质量 特性 和 质量 子 特性 如 图 5-15 所 示 。 


质量 特性 质量 子 特性 质量 特性 质量 子 特性 
一 一 适合 性 
一 一 时 间 特 性 
一 一 准确 性 效率 “一 
功能 性 一 一 一 一 一 互 用 性 一 一 资源 特性 
| ”依从 性 一 一 易 分 析 性 
L_ 安全 性 | 
ar ee 
一 一 成 熟 性 [ee 
可 党 性 一 一 一 一 | 一 容错 性 易 测 试 性 
一 一 易 恢复 性 [一 适应 性 
可 移植 性 | 
易 使 用 性 一 一 一 一 ee i 
起 一 一 易 痊 换 性 
一 一 易 操作 人 性 


5-15 ISOHEC 软件 质量 模型 


其 中 ， 各 质量 特性 和 质量 子 特性 的 含义 如 下 。 
(1) 功能 性 〈Functionality)。 与 一 组 功能 及 其 指定 的 性 质 的 存在 有 关 的 一 组 属性 ， 功 能 是 
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。 ”适应 性 Suitability)。 与 对 规定 任务 能 否 提 供 一 组 功能 以 及 这 组 功能 是 否 适合 有 关 的 
软件 属性 。 
。 ”准确 性 (Accurateness)。 与 能 够 得 到 正确 或 相符 的 结果 或 效果 有 关 的 软件 属性 。 
。 ” 互 用 性 (Interoperability)。 与 其 他 指定 系统 进行 交互 操作 的 能 力 相关 的 软件 属性 。 
。 ”依从 性 (Compliance)。 使 软件 服从 有 关 的 标准 、 约 定 、 法 规 及 类 似 规定 的 软件 属性 。 
。 ”安全 性 (Security)。 与 避免 对 程序 及 数据 的 非 授权 故意 或 意外 访问 的 能 力 有 关 的 软件 
属性 。 
(2) 可 靠 性 (Reliability)。 与 在 规定 的 一 段 时 间 内 和 规定 的 条 件 下 软件 维持 在 其 性 能 水 平 
有 关 的 能 力 。 
。 成熟 性 〈(Maturity)。 与 由 软件 故障 引起 失效 的 频 度 有 关 的 软件 属性 。 
。 ”容错 性 (Fault tolerance)。 与 在 软件 错误 或 违反 指定 接口 的 情况 下 维持 指定 的 性 能 水 
平 的 能 力 有 关 的 软件 属性 。 
。 易 恢 复 性 〈Recoverability)。 与 在 故障 发 生 后 ， 重 新 建立 其 性 能 水 平 并 恢复 直接 受 影 
响 数据 的 能 力 ， 以 及 为 达到 此 目的 所 需 的 时 间 和 努力 有 关 的 软件 属性 。 
(3) 易 使 用 性 Usability)。 与 为 使 用 所 需 的 努力 和 由 一 组 规定 或 隐 含 的 用 户 对 这 样 使 用 所 
做 的 个 别 评价 有 关 的 一 组 属性 。 
。 ” 易 理 解 性 (Understandability)。 与 用 户 为 理解 逻辑 概念 及 其 应 用 所 付出 的 劳动 有 关 的 


软件 属性 。 
。 ”易学 性 (Learnability)。 与 用 户 为 学 习 其 应 用 (例如 操作 控制 、 输 入 、 输 出 》 所 付出 
的 努力 相关 的 软件 属性 。 


。 ” 易 操 作 性 (Operability)。 与 用 户 为 进行 操作 和 操作 控制 所 付出 的 努力 有 关 的 软件 属性 。 
(4) 效率 Efficiency)。 在 规定 条 件 下 ， 与 软件 的 性 能 水 平 与 所 用 资源 量 之 间 的 关系 有 关 
的 软件 属性 。 

。 ”时 间 特 性 (Time behavior)。 与 响应 和 处 理 时间 以 及 软件 执行 其 功能 时 的 吞吐 量 有 关 
的 软件 属性 。 

。 ”资源 特性 (Resource behavior)。 与 软件 执行 其 功能 时 ， 所 使 用 的 资源 量 以 及 使 用 资源 
的 持续 时 间 有 关 的 软件 属性 。 

(5) 可 维护 性 (Maintainability)。 与 进行 规定 的 修改 所 需要 的 努力 有 关 的 一 组 属性 。 

。 ” 易 分 析 性 (Analyzability)。 与 为 诊断 缺陷 或 失效 原因 ， 或 为 判定 待 修改 的 部 分 所 需 努 
力 有 关 的 软件 属性 。 
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。 ” 易 改 变性 (Changeability)。 与 进行 修改 、 排 错 或 适应 环境 变换 所 需 努 力 有 关 的 软件 
属性 。 
。 ”稳定 性 (Stability)。 与 修改 造成 未 预料 效果 的 风险 有 关 的 软件 属性 。 
。 ” 易 测 试 性 (Testability)。 为 确认 经 修改 软件 所 需 努 力 有 关 的 软件 属性 。 
(6) 可 移植 性 (Portability)。 与 软件 可 从 某 一 环境 转移 到 另 一 环境 的 能 力 有 关 的 一 组 属性 。 
。 ”适应 性 (Adaptability)。 与 软件 转移 到 不 同 环境 时 的 处 理 或 手段 有 关 的 软件 属性 。 
。 ” 易 安装 性 (Installability)。 与 在 指定 环境 下 安装 软件 所 需 努 力 有 关 的 软件 属性 。 
。 ”一 致 性 (Conformance)。 使 软件 服从 与 可 移植 性 有 关 的 标准 或 约定 的 软件 属性 。 
。 易 替 换 性 〈Replaceability)。 与 一 软件 在 该 软件 环境 中 用 来 替代 指定 的 其 他 软件 的 可 
能 和 努力 有 关 的 软件 属性 。 
2) Mc Call 软件 质量 模型 
Mc Call 软件 质量 模型 从 软件 产品 的 运行 、 修 正和 转移 3 个 方面 确定 了 11 个 质量 特性 (如 
图 5-16 所 示 )。Mc Call 也 给 出 了 一 个 三 层 模型 框架 ， 第 一 层 是 质量 特性 ， 第 二 层 是 评价 准则 ， 
第 三 层 是 度量 指标 。 


可 维护 性 可 移植 性 
灵活 性 (flexibility) 复 用 性 (reusability) 
可 测试 性 互 用 性 


产品 修正 | 产品 转移 


产品 运行 
product operations 


正确 性 (correctness) ”可 靠 性 易 使 用 性 
效率 (efficiency) 完整 性 (integrity) 


图 5-16 Mc Call 软件 质量 模型 


5.8.2 ”软件 质量 保证 


软件 质量 保证 是 指 为 保证 软件 系统 或 软件 产品 充分 满足 用 户 要 求 的 质量 而 进行 的 有 计划 、 
有 组 织 的 活动 ， 其 目的 是 生产 高 质量 的 软件 。 在 软件 质量 方面 强调 以 下 3 个 要 点 。 
(1) 软件 必须 满足 用 户 规定 的 需求 ， 与 用 户 需 求 不 一 致 的 软件 无 质量 可 言 。 
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(2) 软件 应 遵循 规定 标准 所 定义 的 一 系列 开发 准则 ， 不 遵循 这 些 准则 的 软件 ， 其 质量 难以 
得 到 保证 。 

(3) 软件 还 应 满足 某 些 隐 含 的 需求 ， 例 如 希望 有 好 的 可 理解 性 、 可 维护 性 等 ， 而 这 些 隐 含 
的 需求 可 能 未 被 明确 地 写 在 用 户 规定 的 需求 中 ， 如 果 软 件 只 满足 它 的 显 式 需 求 而 不 满足 其 隐 含 
需求 ， 那 么 该 软件 的 质量 是 令 人 质疑 的 。 

软件 质量 保证 包括 了 与 以 下 7 个 主要 活动 相关 的 各 种 任务 。 

(1) 应 用 技术 方法 。 应 该 把 软件 质量 设计 到 软件 产品 或 软件 系统 中 ， 而 不 是 在 事后 再 施加 
质量 保证 。 由 于 这 个 原因 ， 软 件 质量 保证 首先 从 选择 一 组 技术 方法 和 工具 开始 ， 这 些 方法 和 工 
具 帮 助 分 析 人 员 形 成 高 质量 的 规格 说 明和 高 质量 的 设计 。 

(2) 进行 正式 的 技术 评审 。 一 旦 形成 了 规格 说 明和 设计 ， 就 要 对 它们 进行 质量 评估 。 完 成 
质量 评估 的 中 心 活动 是 正式 的 技术 评审 。 正 式 的 技术 评审 是 一 种 由 技术 人 员 实 施 的 程式 化 会 
议 ， 其 唯一 的 目的 是 揭露 质量 问题 。 在 多 数 情况 下 ， 评 审 能 像 测试 一 样 有 效 地 揭露 软件 中 的 
缺陷 。 

(3) 测试 软件 。 软 件 测试 组 合 了 多 种 测试 策略 ， 这 些 测试 策略 带 有 一 系列 有 助 于 有 效 地 检 
测 错 误 的 测试 用 例 设 计 方 法 。 许 多 软件 开发 人 员 把 软件 测试 用 作 质 量 保证 的 “安全 网 ”， 也 就 
是 说 ， 开 发 人 员 以 为 通过 测试 能 揭露 最 多 的 错误 ， 借 此 减轻 对 其 他 软件 质量 保证 活动 的 需要 。 
遗憾 的 是 ， 即 使 是 完成 得 很 好 的 测试 也 不 会 像 我 们 所 期 望 的 那样 揭露 所 有 的 错误 种 类 。 

(4) 标 准 的 实施 。 对 软件 工程 过 程 应 用 正式 的 开发 标准 和 过 程 的 程度 在 各 公司 中 是 不 同 的 。 
多 数 情况 下 ， 标 准 由 客户 或 者 某 些 章程 确定 。 某 些 场合 下 ， 标 准 是 自己 确定 的 。 如 果 存 在 正式 
的 标准 ， 软 件 质量 保证 活动 必须 保证 遵循 这 些 标 准 。 与 标准 是 否 一 致 的 评估 可 以 被 软件 开发 者 
作为 正式 技术 评审 的 一 部 分 来 进行 。 

(5) 控制 变更 。 对 软件 质量 的 主要 威胁 来 自 “ 变 更 (Change)”。 对 软件 的 每 次 变更 都 有 可 
能 引入 错误 或 者 引起 传播 错误 的 副作用 。 变 更 控制 过 程 是 通过 对 变更 的 正式 申请 、 评 价 变更 的 
特性 和 控制 变更 的 影响 等 直接 提高 软件 的 质量 。 变 更 控制 应 用 在 软件 开发 期 间 和 较 后 的 软件 维 
护 阶 段 。 

(6) 度量 (Metrics)。 度 量 是 任何 工程 科学 必 备 的 活动 。 软 件 质量 保证 的 重要 目标 是 跟踪 
软件 质量 和 评价 方法 学 及 程序 上 的 变更 对 软件 质量 的 影响 程度 。 如 果 要 达到 这 个 目标 ， 应 该 收 
集 软 件 度量 。 软 件 度量 包括 某 些 技术 上 的 和 面向 管理 的 度量 。 

(7) 记录 保存 和 报告 。 记 录 保 存 和 报告 为 软件 质量 保证 提供 收集 和 传播 软件 质量 保证 信息 
的 过 程 。 评 审 、 检 查 、 变 更 控制 、 测 试 和 其 他 软件 质量 保证 活动 的 结果 必须 变 成 项 目 历史 记录 
的 一 部 分 ， 并 且 应 该 把 它 传播 给 需要 知道 这 些 结果 的 开发 人 员 。 例 如 ， 记 录 过 程 设计 的 每 次 正 
式 技术 评审 结果 ， 并 把 记录 放置 在 文件 夹 中 ， 该 文件 夹 包含 了 有 关 模 块 的 所 有 技术 信息 和 软件 
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质量 保证 信息 。 
5.8.3 ”软件 评审 


通常 ， 把 “质量 ”理解 为 “用 户 满意 程度 ”。 为 了 使 得 用 户 满意 ， 有 以 下 两 个 必要 条 件 。 

(1) 设计 的 规格 说 明 书 符合 用 户 的 要 求 ， 这 称 为 设计 质量 。 

(2) 程序 按照 设计 规格 说 明 所 规定 的 情况 正确 执行 ， 这 称 为 程序 质量 。 

软件 的 规格 说 明 分 为 外 部 规格 说 明和 内 部 规格 说 明 。 外 部 规格 说 明 是 从 用 户 角度 来 看 的 规 
格 ， 包 括 硬件 /软件 系统 设计 、 功 能 设计 ; 内 部 规格 说 明 是 为 了 实现 外 部 规格 的 更 详细 的 规格 ， 
即 软件 模块 结构 与 模块 处 理 过 程 的 设计 。 因此 , 内 部 规格 说 明 是 从 开发 者 角度 来 看 的 规格 说 明 。 
设计 质量 是 由 外 部 规格 说 明 决 定 的 ， 程 序 是 由 内 部 规格 说 明 决 定 的 。 

1) 设计 质量 的 评审 内 容 

设计 质量 评审 的 对 象 是 在 需求 分 析 阶 段 产 生 的 软件 需求 规格 说 明 、 数 据 需 求 规格 说 明 ， 以 
及 在 软件 概要 设计 阶段 产生 的 软件 概要 设计 说 明 书 等 。 通 常 从 以 下 几 个 方面 进行 评审 。 

(1) 评价 软件 的 规格 说 明 是 否 合乎 用 户 的 要 求 ， 即 总 体 设计 思想 和 设计 方针 是 否 明确 ; 需 
求 规格 说 明 是 否 得 到 了 用 户 或 单位 上 级 机 关 的 批准 ， 需 求 规格 说 明 与 软件 的 概要 设计 规格 说 明 
是 否 一 致 等 。 

(2) 评审 可 靠 性 ， 即 是 否 能 避免 输入 异常 (错误 或 超载 等 )、 硬 件 失 效 及 软件 失效 所 产生 
的 失效 ， 一 旦 发 生 应 能 及 时 采取 代替 手段 或 恢复 手段 。 

(3) 评审 保密 措施 实现 情况 ， 即 是 否 对 系统 使 用 资格 进行 检查 ， 是 否 对 特定 数据 、 特 定 功 
能 的 使 用 资格 进行 检查 ;在 检查 出 有 违反 使 用 资格 的 情况 后 ， 能 和 否 向 系统 管理 人 员 报告 有 关 信 
息 ; 是 否 提供 对 系统 内 重要 数据 加 密 的 功能 等 。 

(4) 评审 操作 特性 实施 情况 ， 即 操作 命令 和 操作 信息 的 恰当 性 ; 输入 数据 与 输入 控制 语句 
的 恰当 性 ; 输出 数据 的 恰当 性 ;， 应答 时 间 的 恰当 性 等 。 

(5) 评审 性 能 实现 情况 ， 即 是 否 达 到 所 规定 性 能 的 目标 值 。 

(6) 评审 软件 是 否 具 有 可 修改 性 、 可 扩充 性 、 可 互 换 性 和 可 移植 性 。 

(7) 评审 软件 是 否 具 有 可 测试 性 。 

(8) 评审 软件 是 否 具有 复 用 性 。 

2) 程序 质量 的 评审 内 容 

程序 质量 评审 通常 是 从 开发 者 的 角度 进行 评审 ， 与 开发 技术 直接 相关 。 它 是 着 眼 于 软件 本 
身 的 结构 、 与 运行 环境 的 接口 以 及 变更 带 来 的 影响 而 进行 的 评审 活动 。 

软件 的 结构 如 下 。 

(1) 功能 结构 。 在 软件 的 各 种 结构 中 ， 功 能 结构 是 用 户 唯 一 能 见 到 的 结构 。 因 此 ， 功 能 结 
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构 是 联系 用 户 与 开发 者 的 规格 说 明 ， 它 在 软件 的 设计 中 占有 极其 重要 的 地 位 。 在 评审 软件 的 功 
能 结构 时 ， 必 须 明确 软件 的 数据 结构 。 需 要 检查 的 项 目 如 下 。 

。 ”数据 结构 。 包 括 数据 名 和 定义 ;构成 该 数据 的 数据 项 ， 数 据 与 数据 之 间 的 关系 。 

。 ”功能 结构 。 包 括 功 能 名 和 定义 ; 构成 该 功能 的 子 功能 ， 功 能 与 子 功能 之 间 的 关系 。 

。 ”数据 结构 和 功能 结构 之 间 的 对 应 关系 。 包 括 数据 元 素 与 功能 元 素 之 间 的 对 应 关系 ; 数 

据 结构 与 功能 结构 的 一 致 性 。 

(2) 功能 的 通用 性 。 在 软件 的 功能 结构 中 , 某 些 功能 有 时 可 以 作为 通用 功能 反复 出 现 多 次 。 
从 功能 便于 理解 、 增 强 软件 的 通用 性 及 降低 开发 的 工作 量 等 观点 出 发 ， 希 望 尽 可 能 多 地 使 功能 
通用 化 。 另 外 ， 需 检查 的 项 目 包括 抽象 数据 结构 抽象 数据 的 名 称 和 定义 、 抽 象 数 据 组 成 元 素 
的 定义 )、 抽 象 功能 结构 。 

(3) 模块 的 层次 。 模 块 的 层次 是 指 程序 模块 结构 。 由 于 模块 是 功能 的 具体 体现 ， 所 以 模块 
层次 应 当 根 据 功能 层次 来 设计 。 

(4) 模块 结构 。 上 述 的 模块 层次 结构 是 模块 的 静态 结构 ， 现 在 要 检查 模块 的 动态 结构 。 模 
块 分 为 处 理 模块 和 数据 模块 两 类 ， 模 块 间 的 动态 结构 也 与 这 些 模块 分 类 有 关 。 对 这 样 的 模块 结 
构 进行 检查 的 项 目 如 下 。 

。 控制 流 结构 。 规 定 了 处 理 模块 与 处 理 模块 之 间 的 流程 关系 ,检查 处 理 模块 之 间 的 控制 

转移 关系 与 控制 转移 形式 〈 调 用 方式 )。 

。 ”数据 流 结构 。 规 定 了 数据 模块 是 如 何 被 处 理 模 块 进行 加 工 的 流程 关系 ,检查 处 理 模块 

与 数据 模块 之 间 的 对 应 关系 ; 处 理 模块 与 数据 模块 之 间 的 存 取 关 系 。 

。 ”模块 结构 与 功能 结构 之 间 的 对 应 关系 。 包 括 功 能 结构 与 控制 流 结构 的 对 应 关系 ; 功能 

结构 与 数据 流 结构 的 对 应 关系 ; 每 个 模块 的 定义 〈 功 能 、 输 入 /输出 数据 )。 

(5) 处 理 过 程 的 结构 。 处 理 过 程 是 最 基本 的 加 工 逻辑 过 程 。 对 它 的 检查 项 目 有 模块 的 功能 
结构 与 实现 这 些 功能 的 处 理 过程 的 结构 应 明确 对 应 ; 控制 流 应 是 结构 化 的 ， 数据 的 结构 与 控制 
流 之 间 的 对 应 关系 应 是 明确 的 ， 并 且 可 根据 这 种 对 应 关系 来 明确 数据 流程 的 关系 ; 用 于 描述 的 
术语 标准 化 。 

3) 与 运行 环境 的 接口 

运行 环境 包括 硬件 、 其 他 软件 和 用 户 ， 主 要 的 检查 项 目 如 下 。 

(1) 与 硬件 的 接口 。 包 括 与 硬件 的 接口 约定 ， 即 根据 硬件 的 使 用 说 明 等 所 做 出 的 规定 ， 硬 
件 故 障 时 的 处 理 和 超载 时 的 处 理 。 

(2) 与 用 户 的 接口 。 包 括 与 用 户 的 接口 约定 ， 即 输入 数据 的 结构 ; 输出 数据 的 结构 ;异常 
输入 时 的 处 理 ， 超 载 输入 时 的 处 理 ; 用 户 存 取 资 格 的 检查 等 。 
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5.8.4 ”软件 容错 技术 


提高 软件 质量 和 可 靠 性 的 技术 大 致 可 分 为 两 类 ， 一 类 是 避 开 错误 ， 即 在 开发 的 过 程 中 不 让 
差错 潜入 软件 的 技术 ;， 另 一 类 是 容错 技术 ， 即 对 某 些 无 法 避 开 的 差错 ， 使 其 影响 减 至 最 小 的 
技术 。 

1) 容错 软件 的 定义 

归纳 容错 软件 的 定义 ， 有 以 下 4 种 。 

(1) 规定 功能 的 软件 ， 在 一 定 程度 上 对 自身 错误 的 作用 软件 错误 ) 具有 屏蔽 能 力 ， 则 称 
该 软件 为 具有 容错 功能 的 软件 ， 即 容错 软件 。 

(2) 规定 功能 的 软件 ， 在 一 定 程度 上 能 从 错误 状态 自动 恢复 到 正常 状态 ， 则 称 该 软件 为 容 
错 软 件 。 

(3) 规定 功能 的 软件 ， 在 因 错 误 发 生 错 误 时 仍然 能 在 一 定 程度 上 完成 预期 的 功能 ， 则 称 该 
软件 为 容错 软件 。 

(4) 规定 功能 的 软件 ， 在 一 定 程度 上 具有 容错 能 力 ， 则 称 该 软件 为 容错 软件 。 

2) 容错 的 一 般 方法 

实现 容错 的 主要 手段 是 元 余 。 宛 余 是 指 对 于 实现 系统 规定 功能 是 多 余 的 那 部 分 资源 ， 包 括 
硬件 、 软 件 、 信 息 和 时 间 。 由 于 加 入 了 这 些 资 源 ， 有 可 能 使 系统 的 可 靠 性 得 到 较 大 的 提高 。 通 
常 ， 宛 余 技 术 分 为 4 类 。 

(1) 结构 匈 余 。 结 构 见 余 是 通常 采用 的 匈 余 技术 ， 按 其 工作 方法 可 以 分 为 静态 、 动 态 和 泥 
合 见 余 3 种 。 

Q@ 静态 见 余 。 常 用 的 有 三 模 宛 余 (Triple Module Redundancy，TMR) 和 多 模 见 余 。 静 态 
宛 余 通过 表决 和 比较 来 屏蔽 系统 中 出 现 的 错误 。 如 三 模 宛 余 是 对 3 个 功能 相同 但 由 不 同 的 人 采 
用 不 同 的 方法 开发 出 来 的 模块 的 运行 结果 通过 表决 ， 以 多 数 结果 作为 系统 的 最 终结 果 。 即 如 果 
模块 中 有 一 个 出 错 ， 这 个 错误 能 够 被 其 他 模块 的 正确 结果 “屏蔽 ”。 由 于 无 须 对 错误 进行 特别 
的 测试 ， 也 不 必 进 行 模块 的 切换 就 能 实现 容错 ， 故 称 之 为 静态 容错 。 

@ 动态 见 余 。 动 态 见 余 的 主要 方式 是 多 重 模 块 待机 储备 。 当 系统 测试 到 某 工作 模块 出 现 
错误 时 ， 就 用 一 个 备用 模块 来 项 蔡 它 并 重新 运行 。 这 里 包括 检测 、 切 换 和 恢复 过 程 ， 故 称 其 为 
动态 风 余 。 每 当 一 个 出 错 模块 被 其 他 备用 模块 顶替 后 ， 宛 余 系 统 相当 于 进行 了 一 次 重 构 。 各 备 
用 模块 在 其 待机 时 可 与 主 模块 一 同 工 作 ， 也 可 不 工作 。 前 者 称 为 热 备 份 系统 ， 后 者 称 为 冷 备 份 
系统 。 在 热 备份 系统 中 ， 备 用 模块 在 待机 过 程 中 的 失效 率 为 0。 

@ 混合 见 余 。 它 兼 有 静态 元 余 和 动态 元 余 的 长 处 。 

(2) 信息 匈 余 。 为 检测 或 纠正 信息 在 运算 或 传输 中 的 错误 需 外 加 一 部 分 信息 ， 这 种 现象 称 
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为 信息 元 余 。 在 通信 和 计算 机 系统 中 ,信息 常 以 编码 的 形式 出 现 。 采 用 奇偶 码 、 循 环 码 等 见 余 
人 码 制式 就 可 以 发 现 甚至 纠正 这 些 错 误 。 为 了 达到 此 目的 ， 这 些 码 (统称 为 误差 校 验 码 ) 的 码 长 
远 远 大 于 不 考虑 误差 校正 时 的 码 长 ， 增 加 了 计算 量 和 信道 占用 的 时 间 。 

(3) 时 间 宛 余 。 时 间 宛 余 是 指 以 重复 执行 指令 或 程序 来 消除 瞬时 错误 带 来 的 影响 。 对 于 重 
复 执行 不 成 功 的 情况 ， 通 常 的 处 理 办 法 是 发 出 中 断 ， 转 入 错误 处 理 程序 ， 或 对 程序 进行 复 算 ， 
或 重新 组 合 系统 ， 或 放弃 程序 处 理 。 在 程序 复 算 中 比较 常用 的 方法 是 程序 滚 回 〈Program 
Rollback) 技术 。 

(4) 元 余 附加 技术 。 宛 余 附 加 技术 是 指 为 实现 上 述 宛 余 技术 所 需 的 资源 和 技术 , 包括 程序 、 
指令 、 数 据 、 存 放 和 调动 它们 的 空间 和 通道 等 。 

在 屏蔽 硬件 错误 的 容错 技术 中 ， 宛 余 附 加 技术 包括 : 

@ 关键 程序 和 数据 的 宛 余 存储 及 调用 。 

@ 检测 、 表 决 、 切 换 、 重 构 、 纠 错 和 复 算 的 实现 。 

在 屏蔽 软件 错误 的 容错 系统 中 ， 宛 余 附 加 技术 的 构成 包括 : 

@ 宛 余 备份 程序 的 存储 及 调用 。 

@ 实现 错误 检测 和 错误 恢复 的 程序 。 

@ 实现 容错 软件 所 需 的 固化 程序 。 


5.9 软件 度量 


软件 度量 用 于 对 产品 及 开发 产品 的 过 程 进行 度量 。 软 件 产品 、 软 件 过 程 、 资 源 都 具有 外 部 
属性 和 内 部 属性 。 外 部 属性 是 指 面向 管理 者 和 用 户 的 属性 ， 体 现 了 软件 产品 /软件 过 程 与 相关 资 
源 和 环境 的 关系 ， 如 成 本 、 效 益 、 开 发 人 员 的 生产 率 ， 经 常 可 采用 直接 测量 的 方法 进行 。 而 软 
件 的 内 部 属性 是 指 软件 产品 或 软件 过 程 本 身 的 属性 ， 如 可 靠 性 、 可 维护 性 等 ， 只 能 用 间接 测量 
的 方法 度量 ， 间 接 测量 就 需要 一 定 的 测量 方法 或 模型 。 

5.9.1 软件 度量 分 类 


软件 度量 有 两 种 分 类 方法 ， 第 一 种 分 类 是 将 软件 度量 分 为 面向 规模 的 度量 、 面 向 功能 的 度 
量 和 面向 人 的 度量 ;第 二 种 分 类 是 将 软件 度量 分 为 生产 率 度量 、 质 量度 量 和 技术 度量 。 

软件 生产 率 度量 主要 关注 于 软件 工程 活动 的 制品 。 软 件 质量 度量 可 指明 软件 满足 明确 的 和 
隐 含 的 用 户 需求 的 程度 。 技 术 度量 主要 集中 在 软件 产品 的 某 些 特征 〈 如 逻辑 复杂 性 、 模 块 化 程 
度 等 ) 上 ， 而 不 是 软件 开发 的 全 过 程 。 

面向 规模 的 度量 用 于 收集 与 软件 规模 相关 的 软件 工程 输出 信息 和 质量 信息 ,面向 功能 的 度 
量 则 集中 在 程序 的 “功能 性 ”和 “实用 性 ”。 面 向 人 的 度量 收集 有 关 人 们 开发 软件 所 用 方式 的 
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信息 和 人 员 理解 有 关 工 具 的 方法 和 效率 的 信息 。 还 有 基于 问题 、 基 于 过 程 、 基 于 用 例 等 成 本 估 
算 方法 。 
1. 面向 规模 的 度量 


面向 规模 的 度量 是 通过 对 质量 和 或) 生产 率 的 测量 进行 规范 化 得 到 的 ， 而 这 些 量 都 是 根 
据 开 发 过 的 软件 的 规模 得 到 的 。 

软件 规模 通常 用 程序 的 代码 行 (Line of Code，LOC) 或 千 行 代码 KLOC 来 衡量 。 由 于 代 
码 行 自然 、 直 观 地 反映 了 软件 项 目的 规模 ， 也 容易 直接 测量 ， 因 此 面向 规模 的 度量 是 一 种 常用 
的 度量 方法 。 计 算出 软件 项 目的 代码 行 后 ， 可 方便 地 度量 其 他 的 软件 属性 ， 如 软件 开发 的 生产 
率 、 每 行 代码 的 平均 开发 成 本 、 文 档 数量 〈 页 数 ) 与 代码 量 (KLOC) 的 比例 关系 、 每 千 行 代 
码 中 包含 的 软件 错误 数 等 。 表 5-2 给 出 了 面向 规模 的 常用 度量 公式 。 其 中 ， 工 作 量 和 成 本 不 仅 
仅 是 编码 活动 的 工作 量 和 成 本 ， 而 是 指 整个 软件 工程 活动 〈 包 括 分 析 、 设 计 、 编 码 和 测试 ) 的 


工作 量 成 本 。 
表 5-2 面向 规模 的 度量 公式 
度 量 表示 及 含义 
LOC 或 KLOC 代码 行 数 或 千 行 代码 数 
生产 率 己 P=LOC/E， EE 为 开发 的 工作 量 ( 常 用 人 月 数 表示 ) 
每 行 代码 平均 成 本 C C=S/LOC，S 为 总 成 本 
文档 代码 比 D DD= Pe/KLOC，Pe 为 文档 页 数 


代码 错误 率 EQR 


虽然 面向 规模 的 度量 方便 、 直 观 ， 但 代码 行 数 依赖 于 程序 设计 语言 ， 对 于 同一 个 软件 ， 采 
用 不 同 程序 设计 语言 编写 的 程序 ， 代 码 行 数 是 不 同 的 。 同 时 ， 对 于 一 些 因 良好 的 设计 而 导致 代 
码 量 小 的 软件 来 说 ， 这 种 度量 显得 不 够 客观 。 


2. 面向 功能 的 度量 


面向 功能 的 度量 以 功能 〈 由 应 用 程序 提供 ) 测量 数据 作为 规范 化 值 。 应 用 最 广泛 的 面向 功 
能 的 度量 是 功能 点 〈Function Point，FP)。 功 能 点 是 根据 软件 信息 域 的 特性 及 复杂 性 来 计算 的 。 

信息 域 的 值 用 下 列 方式 定义 。 

(1) 外 部 输入 数 〈EI)。 每 个 外 部 输入 源 于 一 个 用 户 ， 或 从 另 一 个 应 用 系统 中 传送 过 来 ， 
它 提供 了 面向 不 同 应 用 系统 的 数据 或 控制 信息 ， 输 入 常用 于 更 新 内 部 逻辑 文件 (ILF)， 输 入 应 
该 与 独立 计数 的 查询 区 分 开 来 。 

(2) 外 部 输出 数 (EO)。 每 个 外 部 输出 从 应 用 系统 中 导出 ， 并 为 用 户 提供 信息 。 在 这 种 情 
况 下 ， 外 部 输出 指 的 是 报告 、 屏 幕 、 错 误 消息 等 ， 不 对 报告 中 的 单独 数据 项 进行 分 开 计 数 。 


EQR=NKLOC， 为 代码 中 的 错误 数 
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(3) 外 部 查询 数 (EQ)。 一 个 外 部 查询 定义 为 一 个 在 线 输入 。 其 结果 是 以 在 线 输出 〈 经 常 
从 ILF 中 得 到 ) 的 方式 产生 某 个 即时 软件 响应 。 

(4) 内 部 逻辑 文件 数 (ILF)。 每 个 内 部 逻辑 文件 是 驻 留 在 应 用 系统 边界 之 内 的 数据 逻辑 分 
组 ， 它 通过 外 部 输入 来 维护 。 

(5) 外 部 接口 文件 数 (EIF)。 每 个 外 部 接口 文件 是 驻 留 在 应 用 系统 外 部 的 数据 逻辑 分 组 ， 
它 通 过 应 用 系统 提供 有 用 的 信息 。 

利用 下 面 的 关系 式 计 算 功 能 点 : 

Fp= 总 计 X[0.65+001X 了 (ED] 

其 中 ,“ 总 计 ” 是 所 有 Fp 项 的 总 数 。Fi(i= 1 一 14) 是 值 调整 因子 。 


5.9.2 软件 复杂 性 度量 


软件 复杂 性 是 指 理解 和 处 理 软 件 的 难 易 程度 。 软 件 复杂 性 度量 的 参数 很 多 ， 主 要 有 以 下 儿 个 。 
。 规模。 规模 即 总 共 的 指令 数 ， 或 源 程序 行 数 。 

。 ”难度 。 通 常 由 程序 中 出 现 的 操作 数 的 数目 所 决定 的 量 来 表示 。 

。 ”结构 。 通 常用 与 程序 结构 有 关 的 度量 来 表示 。 

。 ”智能 度 。 智 能 度 即 算 法 的 难 易 程度 。 

软件 复杂 性 包括 程序 复杂 性 和 文档 复杂 性 ， 软 件 复杂 性 主要 体现 在 程序 的 复杂 性 中 。 


1. 程序 复杂 性 度量 原则 


程序 复杂 性 度量 是 软件 度量 的 重要 组 成 部 分 。 开 发 规模 相同 、 复 杂 性 不 同 的 程序 花费 的 时 
间 和 成 本 会 有 很 大 的 差异 。K. Magel 从 以 下 5 个 方面 描述 程序 的 复杂 性 。 

。 ”程序 理解 的 难度 。 

。 ” 纠 错 、 维 护 程序 的 难度 。 

。 ”向 他 人 解释 程序 的 难度 。 

。 ”根据 设计 文件 编写 程序 的 工作 量 。 

。 ”执行 程序 时 需要 资源 的 程度 。 

普遍 认为 ， 程 序 复杂 性 度量 模型 应 遵循 以 下 基本 原则 。 

。 ”程序 复杂 性 与 程序 大 小 的 关系 不 是 线性 的 。 

。 ”控制 结构 复杂 的 程序 较 复杂 。 

。 ”数据 结构 复杂 的 程序 较 复杂 。 

。 ”转向 语句 使 用 不 当 的 程序 较 复杂 。 

。 ”循环 结构 比 选择 结构 复杂 ， 选 择 结构 又 比 顺序 结构 复杂 。 

。 ”语句 、 数 据 、 子 程序 和 模块 在 程序 中 的 次 序 对 复杂 性 有 影响 。 
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。 ”全 局 变量 、 非 局 部 变量 较 多 时 程序 较 复杂 。 

。 ”函数 的 隐 式 副作用 相对 于 显 式 参数 传递 而 言 更 加 难以 理解 。 

。 ”具有 不 同 作用 的 变量 共用 一 个 名 字 时 较 难 理解 。 

。 ”模块 间 、 过 程 间 联 系 密切 的 程序 比较 复杂 。 

。 和民 套 程度 越 深 ， 程 序 越 复杂 。 

典型 的 程序 复杂 性 度量 有 McCabe 环 路 复杂 性 度量 和 Halstead 的 复杂 性 度量 ， 本 节 主 要 介 
绍 McCabe 度量 法 


2. McCabe 度量 法 


McCabe 度量 法 是 由 Thomas McCabe 提出 的 一 种 基于 程序 控制 流 的 复杂 性 度量 方法 。 
McCabe 复杂 性 度量 又 称 为 环 路 度量 , 它 认 为 程序 的 复杂 性 在 很 大 程度 上 取决 于 控制 的 复杂 性 。 
单一 的 顺序 程序 结构 最 为 简单 ， 循 环 和 选择 构成 的 环 路 越 多 ， 程 序 就 越 复 杂 。 这 种 方法 以 图 论 
为 工具 ， 先 画 出 程序 图 ， 然 后 用 该 图 的 环 路 数 作为 程序 复杂 性 的 度量 值 。 程 序 图 是 退化 的 程序 
流程 图 ， 也 就 是 说 ， 把 程序 流程 图 中 的 每 个 处 理 符 号 都 退化 成 一 个 结 点 ， 原 来 连接 不 同 处 理 符 
号 的 流 线 变 成 连接 不 同 点 的 有 向 弧 ， 这 样 得 到 的 有 向 图 称 为 程序 图 ， 如 图 5-17 所 示 。 程序 图 仅 
描述 程序 内 部 的 控制 流程 ， 完 全 不 表现 对 数据 的 
具体 操作 以 及 分 支 和 循环 的 具体 条 件 。 

根据 图 论 , 在 一 个 强 连 通 的 有 向 图 G 中 , 环 
的 个 数 的 GO) 由 以 下 公式 给 出 : 

WG)=m—n+2p 
其 中 ，K(G) 是 有 向 图 G 中 的 环 路 数 ，m 是 图 G 
中 弧 的 个 数 ，n 是 图 G 中 的 结 点 数 ，p 是 G 中 
的 强 连 通 分 量 个 数 。 在 一 个 程序 中 ， 从 程序 图 
的 入 口 点 总 能 到 达 图 中 的 任何 一 个 结 点 ， 因 
此 ， 程 序 总 是 连通 的 ， 但 不 是 强 连通 的 。 为 了 
使 程序 图 成 为 强 连通 图 ， 从 图 的 入 口 点 到 出 口 
点 加 一 条 用 虚线 表示 的 有 向 边 ， 使 图 成 为 强 连 
通 图 。 这 样 就 可 以 使 用 上 式 计 算 环 路 复杂 性 了 。 

以 图 5-17 为 例 , 其 中 结 点 数 n=6, 弧 数 m=9， 图 5-17 程序 图 的 复杂 性 

p=1， 则 有 : 


WO=mnt2p=9612=5 
即 McCabe 环 路 复杂 的 度量 值 为 5。 
环 路 复杂 性 度量 反映 了 程序 〈 或 模块 ) 的 控制 结构 的 复杂 性 。McCabe 发 现 AG)=10 是 一 
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个 实际 模块 的 上 限 。 当 模块 的 环 路 复杂 度 超 过 10 时 ， 要 充分 测试 这 个 模块 变 得 特别 难 。 
5.10 ”软件 工具 与 软件 开发 环境 


自从 提出 了 软件 工程 的 概念 以 后 ， 人 们 一 方面 着 重 于 开发 模型 和 开发 方法 的 研究 ， 以 指导 
软件 开发 工作 的 顺利 进行 ， 另 一 方面 着 重 于 软件 工具 和 环境 的 研究 ， 以 低 成 本 、 高 效率 的 方式 
辅助 软件 的 开发 。 于 是 出 现 了 对 计算 机 辅助 软件 工程 “Computer Aided Software Engineering， 
CASE) 的 研究 和 实现 。 

计算 机 辅助 软件 工程 是 指使 用 计算 机 及 相关 的 软件 工具 辅助 软件 开发 、 维 护 、 管 理 等 过 程 
中 各 项 活动 的 实施 ， 以 确保 这 些 活动 能 高 效率 、 高 质量 地 进行 。 


5.10.1 软件 工具 


用 来 辅助 软件 开发 、 运 行 、 维 护 、 管 理 和 支持 等 过 程 中 的 活动 的 软件 称 为 软件 工具 。 早 期 
的 软件 工具 主要 用 来 辅助 程序 员 编程 ， 如 编辑 程序 、 编 译 程序 和 排 错 程序 等 。 在 提出 了 软件 工 
程 的 概念 以 后 ， 又 出 现 了 软件 生存 周期 的 概念 ， 出 现 了 许多 开发 模型 和 开发 方法 ， 并 且 软件 管 
理 也 开始 受到 人 们 的 重视 。 与 此 同时 ， 出 现 了 一 批 软 件 工具 来 辅助 软件 工程 的 实施 ， 这 些 软件 
工具 涉及 软件 开发 、 维 护 、 管 理 过 程 中 的 各 项 活动 ， 并 辅助 这 些 活动 高 效 、 高 质量 地 进行 。 


1. 软件 开发 工具 


对 应 于 软件 开发 过 程 的 各 种 活动 ， 软 件 开发 工具 通常 有 需求 分 析 工 具 、 设 计 工 具 、 编 码 与 
排 错 工具 、 测 试 工具 等 。 

(1) 需求 分 析 工 具 。 用 于 辅助 软件 需求 分 析 活 动 的 软件 称 为 需求 分 析 工 具 ， 它 辅助 系统 分 
析 员 从 需求 定义 出 发 ， 生 成 完整 的 、 清 晰 的 、 一 致 的 功能 规范 (Functional Specification)。 功 能 
规范 是 软件 所 要 完成 功能 的 准确 而 完整 的 陈述 ， 它 描述 该 软件 要 做 什么 以 及 只 做 什么 。 

按照 需求 定义 的 方法 可 将 需求 分 析 工 具 分 为 基于 自然 语言 或 图 形 描述 的 工具 和 基于 形式 
化 需求 定义 语言 的 工具 。 

(2) 设计 工具 。 用 于 辅助 软件 设计 活动 的 软件 称 为 设计 工具 ， 它 辅助 设计 人 员 从 软件 功能 
规范 出 发 ， 得 到 相应 的 设计 规范 (Design Specification)。 对 应 于 概要 设计 活动 和 详细 设计 活动 ， 
设计 工具 通常 可 分 为 概要 设计 工具 和 详细 设计 工具 。 

概要 设计 工具 用 于 辅助 设计 人 员 设 计 目 标 软件 的 体系 结构 、 控 制 结构 和 数据 结构 ， 详 细 设 
计 工 具 用 于 辅助 设计 人 员 设 计 模块 的 算法 和 内 部 实现 细节 。 除 此 之 外 ， 还 有 基于 形式 化 描述 的 
设计 工具 和 面向 对 象 的 分 析 与 设计 工具 。 

(3) 编码 与 排 错 工具 。 辅 助 程序 员 进 行 编码 活动 的 工具 有 编码 工具 和 排 错 工具 。 编 码 工 具 


国 31 


国 32 基 。 钦 人 设计 师 教程 (第 5 版) 


辅助 程序 员 用 某 种 程序 设计 语言 编写 源 程序 , 并 对 源 程序 进行 翻译 , 最 终 转换 成 可 执行 的 代码 。 
因此 ， 编 码 工具 通常 与 编码 所 使 用 的 程序 语言 密切 相关 。 排 错 工具 用 来 辅助 程序 员 寻 找 源 程序 
中 错误 的 性 质 和 原因 ， 并 确定 其 出 错 的 位 置 。 

(4) 测试 工具 。 用 于 支持 软件 测试 的 工具 称 为 测试 工具 ， 它 分 为 数据 获取 工具 、 静 态 分 析 
工具 、 动 态 分析 工 具 、 模 拟 工具 以 及 测试 管理 工具 。 其 中 ， 静 态 分 析 工 具 通 过 对 源 程序 的 程序 
结构 、 数 据 流 和 控制 流 进行 分 析 ， 得 出 程序 中 函数 过程) 的 调用 与 被 调用 关系 、 分支 和 路 径 、 
变量 定义 和 引用 等 情况 ， 发 现 语 义 错 误 。 动 态 分 析 工 具 通 过 执行 程序 检查 语句 、 分 支 和 路 径 覆 
盖 ， 测 试 有 关 变 量 值 的 断 点 ， 即 对 程序 的 执行 流 进行 探测 。 


2. 软件 维护 工具 


辅助 软件 维护 过 程 中 活动 的 软件 称 为 软件 维护 工具 , 它 辅助 维护 人 员 对 软件 代码 及 其 文档 
进行 各 种 维护 活动 。 软 件 维护 工具 主要 有 版 本 控制 工具 、 文 档 分 析 工 具 、 开 发 信息 库 工 具 、 北 
向 工程 工具 和 再 工程 工具 。 

(1) 版 本 控制 工具 。 在 软件 开发 和 维护 过 程 中 ， 一 个 软件 往往 有 多 个 版 本 ， 版 本 控制 工具 
用 来 存储 、 更 新 、 恢 复 和 管理 一 个 软件 的 多 个 版 本 。 

(2) 文档 分 析 工 具 。 文 档 分 析 工 具 用 来 对 软件 开发 过 程 中 形成 的 文档 进行 分 析 ， 给 出 软件 
维护 活动 所 需 的 维护 信息 。 例 如 ， 基 于 数据 流 图 的 需求 文档 分 析 工 具 可 以 给 出 对 数据 流 图 的 某 
个 成 分 (如 加 工 ) 进行 维护 时 的 影响 范围 及 被 影响 范围 ， 以 使 在 修改 该 成 分 的 同时 考虑 其 影响 
范围 内 的 其 他 成 分 是 否 也 要 修改 。 除 此 之 外 ， 利 用 文档 分 析 工具 还 可 以 得 到 被 分 析 文档 的 有 关 
信息 ， 例 如 文档 各 种 成 分 的 个 数 、 定 义 及 引用 情况 等 。 

(3) 开发 信息 库 工具 。 开 发 信息 库 工具 用 来 维护 软件 项 目的 开发 信息 , 包括 对 象 、 模 块 等 。 
它 记 录 每 个 对 象 的 修改 信息 (已 确定 的 错误 及 重要 改动 ) 和 其 他 变形 (如 抽象 数据 结构 的 多 种 
实现 )， 还 必须 维护 对 象 和 与 之 有 关 信 息 之 间 的 关系 。 

(4) 道 向 工程 工具 。 逆 向 工程 工具 辅助 软件 人 员 将 某 种 形式 表示 的 软件 〈 源 程序 ) 转换 成 
更 高 抽象 形式 表示 的 软件 。 这 种 工具 力求 恢复 源 程序 的 设计 信息 ， 使 软件 变 得 更 容易 理解 。 逆 
向 工程 工具 分 为 静态 的 和 动态 的 两 种 。 

(5) 再 工程 工具 。 再 工程 工具 用 来 支持 重 构 一 个 功能 和 性 能 更 为 完善 的 软件 系统 。 目 前 的 
再 工程 工具 主要 集中 在 代码 重 构 、 程 序 结构 重 构 和 数据 结构 重 构 等 方面 。 


3. 软件 管理 和 软件 支持 工具 


软件 管理 和 软件 支持 工具 用 来 辅助 管理 人 员 和 软件 支持 人 员 的 管理 活动 和 支持 活动 ， 以 确 
保 软件 高 质量 地 完成 。 辅助 软件 管理 和 软件 支持 的 工具 很 多 , 其 中 常用 的 工具 有 项 目 管理 工具 、 
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配置 管理 工具 和 软件 评价 工具 。 

(1) 项 目 管理 工具 。 项 目 管理 工具 用 来 辅助 软件 的 项 目 管理 活动 。 通 常 ， 项 目 管理 活动 包 
括 项 目的 计划 、 调 度 、 通 信 、 成 本 估算 、 资 源 分 配 及 质量 控制 等 。 一 个 项 目 管理 工具 通常 把 重 
点 放 在 某 一 个 或 某 几 个 特定 的 管理 环节 上 ， 而 不 提供 对 管理 活动 包罗 万 象 的 支持 。 

(2) 配置 管理 工具 。 配置 管理 工具 用 来 辅助 完成 软件 配置 项 的 标识 、 版 本 控制 、 变 化 控制 、 
审计 和 状态 统计 等 基本 任务 ， 使 得 各 配置 项 的 存 取 、 修 改 和 系统 生成 易于 实现 ， 从 而 简化 审计 
过 程 ， 改 进 状态 统计 ， 减 少 错误 ， 提 高 系统 的 质量 。 

(3) 软件 评价 工具 。 软 件 评价 工具 用 来 辅助 管理 人 员 进 行 软件 质量 保证 的 有 关 活 动 。 它 通 
常 可 以 按照 某 个 软件 质量 模型 (如 McCall 软件 质量 模型 、ISO 软件 质量 度量 模型 等 ) 对 被 评价 
的 软件 进行 度量 ， 然 后 得 到 相关 的 软件 评价 报告 。 软 件 评价 工具 有 助 于 软件 质量 控制 ， 对 确保 
软件 质量 有 重要 的 作用 。 

软件 工具 的 种 类 非常 多 ， 上 面 只 列举 了 一 些 主要 的 也 是 常用 的 工具 。 软 件 工具 可 以 从 不 同 
的 角度 进行 分 类 ， 上 述 分 类 只 是 其 中 较 流 行 的 一 种 ， 而 且 这 种 分 类 并 非 是 严格 的 ， 有 些 工 具 可 
以 属于 这 一 类 ， 也 可 以 属于 另 一 类 。 


5.10.2 ”软件 开发 环境 


软件 开发 环境 (Software Development Environment) 指 支持 软件 产品 开发 的 软件 系统 ， 它 
由 软件 工具 集 和 环境 集成 机 制 构成 。 工 具 集 用 于 支持 软件 开发 的 相关 过 程 、 活 动 和 任务 ;环境 
集成 机 制 为 工具 集成 和 软件 开发 、 维 护 和 管理 提供 统一 的 支持 。 

环境 集成 机 制 主要 有 数据 集成 、 界 面 集成 和 控制 集成 ,还 有 其 他 方面 的 集成 ， 例 如 平台 集 
成 、 方 法 与 过 程 集成 等 。 

数据 集成 为 各 种 相互 协作 的 工具 提供 统一 的 数据 模式 和 数据 接口 规范 ， 以 实现 不 同 工 具 之 
间 的 数据 交换 。 

界面 集成 指环 境 中 的 工具 的 界面 使 用 统一 的 风格 ， 采 用 相同 的 交互 方法 ， 提 供 一 种 相似 的 
视 感 效果 ， 这 样 可 以 减少 用 户 学 习 不 同 工 具 的 开销 。 

控制 集成 用 于 支持 环境 中 各 个 工具 或 开发 活动 之 间 的 通信 、 切 换 、 调 度 和 协同 工作 ， 并 支 
持 软件 开发 过 程 的 描述 、 执 行 与 转换 。 

方法 与 过 程 集成 指 把 多 种 开发 方法 、 过 程 模型 及 其 相关 工具 集成 在 一 起 。 

平台 集成 是 指 在 不 同 的 硬件 和 系统 软件 之 上 构造 用 户 界面 一 致 的 开发 平台 ， 并 集成 到 统一 
的 环境 中 。 

软件 开发 环境 的 特征 如 下 。 

(1) 环境 的 服务 是 集成 的 。 软 件 开发 环境 应 支持 多 种 集成 机 制 ， 如 平台 集成 、 数 据 集成 、 
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界面 集成 、 控 制 集成 和 过 程 集成 等 。 

(2) 环境 应 支持 小 组 工作 方式 ， 并 为 其 提供 配置 管理 。 

(3) 环境 的 服务 可 用 于 支持 各 种 软件 开发 活动 ， 包 括 分 析 、 设 计 、 编 程 、 测 试 、 调 试 和 文 
档 等 。 

集成 型 开发 环境 是 一 种 把 支持 多 种 软件 开发 方法 和 开发 模型 的 软件 工具 集成 在 一 起 的 软 
件 开 发 环境 。 这 种 环境 应 该 具有 开放 性 和 可 剪裁 性 。 开 放 性 为 环境 外 的 工具 集成 到 环境 中 来 提 
供 了 方便 ， 可 剪裁 性 可 根据 不 同 的 应 用 和 不 同 的 用 户 需求 进行 剪裁 ， 以 形成 特定 的 开发 环境 。 
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结构 化 方法 由 结构 化 分 析 、 结 构 化 设计 、 结 构 化 程序 设计 构成 ， 它 是 一 种 面向 数据 流 的 开 
发 方法 。 结 构 化 分 析 是 根据 分 解 与 抽象 的 原则 ， 按 照 系统 中 数据 处 理 的 流程 ， 用 数据 流 图 来 建 
立 系 统 的 功能 模型 ， 从 而 完成 需求 分 析 工 作 。 结 构 化 设计 是 根据 模块 独立 性 准则 、 软 件 结构 优 
化 准则 将 数据 流 图 转换 为 软件 的 体系 结构 ， 用 软件 结构 图 来 建立 系统 的 物理 模型 ， 实 现 系 统 的 
概要 设计 。 结 构 化 程序 设计 使 用 3 种 基本 控制 结构 构造 程序 ， 任 何 程序 都 可 以 由 顺序 、 选 择 和 
重复 3 种 基本 控制 结构 构造 。 

结构 化 方法 总 的 指导 思想 是 自 顶 向 下 、 逐 层 分 解 ， 它 的 基本 原则 是 功能 的 分 解 与 抽象 。 它 
是 软件 工程 中 最 早出 现 的 开发 方法 ， 特 别 适合 于 数据 处 理 领域 的 问题 ， 但 是 不 适合 解决 大 规模 
的 、 特 别 复杂 的 项 目 ， 且 难以 适应 需求 的 变化 。 

本 章 的 主要 内 容 包 括 系 统 分 析 与 设计 知识 、 结 构 化 分 析 与 设计 知识 、WebApp 的 分 析 与 设 
计 知识 、 用 户 界面 设计 知识 。 


6.1 系统 分 析 与 设计 概述 


6.1.1 系统 分 析 概 述 


系统 分 析 是 一 种 问题 求解 技术 ， 它 将 一 个 系统 分 解 成 各 个 组 成 部 分 ， 目 的 是 研究 各 个 部 分 
如 何 工作 、 交 互 ， 以 实现 其 系统 目标 。 系 统 分 析 的 目的 是 为 项 目 团队 提供 对 和 触发 项 目的 问题 和 
需求 的 更 全 面 的 理解 ， 因 此 强调 业务 问题 方面 ， 而 非 技术 或 实现 方面 。 系 统 分 析 阶 段 要 求 和 系 
统 用 户 一 起 工作 ， 以 便 清 楚 地 定义 新 系统 的 业务 需求 和 预期 。 


1. 系统 分 析 的 目的 和 任务 


系统 分 析 的 主要 任务 是 对 现行 系统 进一步 详细 调查 ， 将 调查 中 所 得 到 的 文档 资料 集中 ， 对 
组 织 内 部 整体 管理 状况 和 信息 处 理 过 程 进行 分 析 ， 为 系统 开发 提供 所 需 的 资料 ， 并 提交 系统 方 
案 说 明 书 。 系 统 分 析 侧 重 于 从 业务 全 过 程 的 角度 进行 分 析 ， 主 要 内 容 有 业务 和 数据 的 流程 是 否 
通畅 、 是 否 合理 ， 数 据 、 业 务 过 程 和 组 织 管理 之 间 的 关系 ; 原 系统 管理 模式 改革 和 新 系统 管理 
方法 的 实现 是 否 具有 可 行 性 等 。 
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确定 的 分 析 结 果 包 括 开 发 者 对 于 现 有 组 织 管理 状况 的 了 解 ， 用 户 对 信息 系统 功能 的 需求 ， 
数据 和 业务 流程 ， 管 理 功能 和 管理 数据 指标 体系 以 及 新 系统 拟 改动 和 新 增 的 管理 模型 等 。 


最 后 ， 提 出 信息 系统 的 各 种 设想 和 方案 ， 并 对 所 有 的 设想 和 方案 进行 分 析 、 研 究 、 


判断 和 选择 ， 获 得 一 个 最 优 的 新 系统 的 逻辑 模型 ， 并 在 用 户 理解 计算 机 系统 的 工作 流程 和 处 理 


方式 的 情况 下 ， 将 它 明确 地 表达 成 书面 资料 一 系统 分 析 报 告 ， 即 系统 方案 说 明 书 。 
2. 系统 分 析 的 主要 步骤 


比较 、 


企业 信息 系统 是 一 个 具有 业务 复杂 性 和 技术 复杂 性 的 大 系统 ,为 的 是 目标 系统 既 能 实现 当 
前 系统 的 基本 职能 ， 又 能 改进 和 提高 。 系 统 开发 人 员 首 先 必须 理解 并 描述 出 已 经 实际 存在 的 当 
前 系统 ， 然 后 进行 改进 ， 从 而 创造 出 基于 当前 系统 又 高 于 当前 系统 的 目标 系统 ， 即 新 系统 。 


系统 分 析 过 程 一 般 按 如 图 6-1 所 示 的 逻辑 进行 。 
当前 系统 目标 系统 


模型 


逻辑 
模型 


补充 和 完善 
图 6-1 系统 分 析 过 程 图 


(1) 认识 、 理 解 当前 的 现实 环境 ， 获 得 当前 系统 的 “物理 模型 ”。 

(2) 从 当前 系统 的 “物理 模型 ”抽象 出 当前 系统 的 “逻辑 模型 ”。 

(3) 对 当前 系统 的 “逻辑 模型 ”进行 分 析 和 优化 ， 建 立 目标 系统 的 “逻辑 模型 ”。 
(4) 对 目标 系统 的 逻辑 模型 具体 化 (物理 化 )， 建 立 目标 系统 的 物理 模型 。 

系统 开发 的 目的 是 把 现 有 系统 的 物理 模型 转化 为 目标 系统 的 物理 模型 ， 即 图 6-1 9 


P 双 虚线 


所 描述 的 路 径 ， 而 系统 分 析 阶 段 的 结果 是 得 到 目标 系统 的 逻辑 模型 。 风 辑 模型 反映 了 系统 的 功 


能 和 性 质 ， 而 物理 模型 反映 的 是 系统 的 某 一 种 具体 实现 方案 。 
按照 图 6-1， 可 将 系统 分 析 阶 段 的 主要 工作 分 为 以 下 几 步 。 
(1) 对 当前 系统 进行 详细 调查 ， 收 集 数据 。 
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(2) 建立 当前 系统 的 逻辑 模型 。 

(3) 对 现状 进行 分 析 ， 提 出 改进 意见 和 新 系统 应 达到 的 目标 。 
(4) 建立 新 系统 的 逻辑 模型 。 

(5) 编写 系统 方案 说 明 书 。 


6.1.2 ”系统 设计 的 基本 原理 
1. 抽象 


抽象 是 一 种 设计 技术 ， 重 点 说 明 一 个 实体 的 本 质 方面 ， 而 忽略 或 者 掩盖 不 太 重 要 或 非 本 质 
的 方面 。 抽 象 是 一 种 重要 的 工具 ， 用 来 将 复杂 的 现象 简化 到 可 以 分 析 、 实 验 或 者 可 以 理解 的 程 
度 。 软 件 工程 中 从 软件 定义 到 软件 开发 要 经 历 多 个 阶段 ， 在 这 个 过 程 中 每 前 进一步 都 可 看 作 是 
对 软件 解法 的 抽象 层次 的 一 次 细 化 。 抽 象 的 最 底层 就 是 实现 该 软件 的 源 程序 代码 。 在 进行 模块 
化 设计 时 也 可 以 有 多 个 抽象 层次 ， 最 高 抽象 层次 的 模块 用 概括 的 方式 叙述 问题 的 解法 ， 较 低 抽 
象 层次 的 模块 是 较 高 抽象 层次 模块 对 问题 解法 描述 的 细 化 。 


2. 模块 化 


模块 在 程序 中 是 数据 说 明 、 可 执行 语句 等 程序 对 象 的 集合 , 或 者 是 单独 命名 和 编 址 的 元 素 ， 
例如 高 级 语言 中 的 过 程 、 函 数 和 子 程序 等 。 在 软件 的 体系 结构 中 ， 模 块 是 可 组 合 、 分 解 和 更 换 
的 单元 。 

模块 化 是 指 将 一 个 待 开发 的 软件 分 解 成 若干 个 小 的 简单 部 分 一 一 模块 ， 每 个 模块 可 独立 地 
开发 、 测 试 ， 最 后 组 装 成 完整 的 程序 。 这 是 一 种 复杂 问题 “分 而 治之 ”的 原则 。 模 块 化 的 目的 
是 使 程序 的 结构 清晰 ， 容 易 阅 读 、 理 解 、 测 试 和 修改 。 


3. 信息 隐蔽 


信息 隐蔽 是 开发 整体 程序 结构 时 使 用 的 法 则 ， 即 将 每 个 程序 的 成 分 隐蔽 或 封装 在 一 个 单一 
的 设计 模块 中 ， 在 定义 每 一 个 模块 时 尽 可 能 少 地 显露 其 内 部 的 处 理 。 在 设计 时 首先 列 出 一 些 可 
能 发 生变 化 的 因素 ， 在 划分 模块 时 将 一 个 可 能 发 生变 化 的 因素 隐蔽 在 某 个 模块 的 内 部 ， 使 其 他 
模块 与 这 个 因素 无 关 。 当 这 个 因素 发 生变 化 时 ， 只 需 修改 含有 这 个 因素 的 模块 ， 而 与 其 他 模块 
无 关 。 

信息 隐蔽 原则 对 提高 软件 的 可 修改 性 、 可 测试 性 和 可 移植 性 都 有 重要 的 作用 。 


4. 模块 独立 


模块 独立 是 指 每 个 模块 完成 一 个 相对 独立 的 特定 子 功能 ， 并 且 与 其 他 模块 之 间 的 联系 简 
单 。 衡 量 模块 独立 程度 的 标准 有 两 个 : 耦合 性 和 内 聚 性 。 
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1) 耦合 
合 是 模块 之 间 的 相对 独立 性 〈 互 相连 接 的 紧密 程度 ) 的 度量 。 耦 合 取决 于 各 个 模块 之 间 
接口 的 复杂 程度 、 调 用 模块 的 方式 以 及 通过 接口 的 信息 类 型 等 。 一 般 模块 之 间 可 能 的 耦合 方式 
有 7 种 类 型 ， 如 图 6-2 所 示 。 


模块 独立 性 


图 6-2 ”耦合 的 种 类 


。 无 直接 耦合 。 指 两 个 模块 之 间 没 有 直接 的 关系 ， 它 们 分 别 从 属于 不 同 模块 的 控制 与 调 
用 ， 它 们 之 间 不 传递 任何 信息 。 因 此 ， 模 块 间 耦 合 性 最 弱 ， 模 块 独立 性 最 高 。 

。 ”数据 看 合 。 指 两 个 模块 之 间 有 调用 关系 ,传递 的 是 简单 的 数据 值 ， 相 当 于 高 级 语言 中 
的 值 传递 。 

。 标记 耦合 。 指 两 个 模块 之 间 传 递 的 是 数据 结构 。 

。 控制 耦合 。 指 一 个 模块 调用 另 一 个 模块 时 ， 传 递 的 是 控制 变量 ， 被 调用 模块 通过 该 控 
制 变量 的 值 有 选择 地 执行 模块 内 的 某 一 功能 。 因 此 ， 被 调用 模块 应 具有 多 个 功能 ， 哪 
个 功能 起 作用 受 调用 模块 控制 。 

。 外 部 耦合 。 模 块 间 通 过 软件 之 外 的 环境 联结 〈 如 IO 将 模块 耦合 到 特定 的 设备 、 格 式 、 
通信 协议 上 ) 时 称 为 外 部 耦合 。 

。 公共 耦合 。 指 通过 一 个 公共 数据 环境 相互 作用 的 那些 模块 间 的 耦合 。 

。 内 容 耦 合 。 当 一 个 模块 直接 使 用 另 一 个 模块 的 内 部 数据 ， 或 通过 非 正 常 入 口 转 入 另 一 
个 模块 内 部 时 ， 这 种 模块 之 间 的 耦合 称 为 内 容 耦 合 。 

2) 内 聚 

内 聚 是 对 一 个 模块 内 部 各 个 元 素 彼此 结合 的 紧密 程度 的 度量 。 一 个 内 聚 程度 高 的 模块 (在 

理想 情况 下 ) 应 当 只 做 一 件 事 。 一 般 模 块 的 内 聚 性 分 为 7 种 类 型 ， 如 图 6-3 所 示 。 


图 6-3 ”内 聚 的 种 类 
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。 ”偶然 内 聚 〈 巧 合 内 聚 )。 指 一 个 模块 内 的 各 处 理 元 素 之 间 没 有 任何 联系 。 

。 ”逻辑 内 肾 。 指 模块 内 执行 若干 个 逻辑 上 相似 的 功能 ， 通 过 参数 确定 该 模块 完成 哪 一 个 
功能 。 

。 时 间 内 聚 。 把 需要 同时 执行 的 动作 组 合 在 一 起 形成 的 模块 称 为 时 间 内 聚 模块 。 

。 ”过程 内 聚 。 指 一 个 模块 完成 多 个 任务 ， 这 些 任务 必须 按 指 定 的 过 程 执行 。 

。 通信 内 聚 。 指 模块 内 的 所 有 处 理 元 素 都 在 同一 个 数据 结构 上 操作 ， 或 者 各 处 理 使 用 相 
同 的 输入 数据 或 者 产生 相同 的 输出 数据 。 

。 顺序 内 聚 。 指 一 个 模块 中 的 各 个 处 理 元 素 都 密切 相关 于 同一 功能 且 必 须 顺 序 执行 ， 前 
一 功能 元 素 的 输出 就 是 下 一 功能 元 素 的 输入 。 

。 ”功能 内 聚 。 这 是 最 强 的 内 聚 ， 指 模块 内 的 所 有 元 素 共同 作用 完成 一 个 功能 ， 缺 一 不 可 。 

耦合 性 和 内 聚 性 是 模块 独立 性 的 两 个 定性 标准 ， 在 将 软件 系统 划分 模块 时 ， 应 尽量 做 到 高 

内 聚 、 低 耦合 ， 提 高 模块 的 独立 性 。 


6.1.3 ”系统 总 体 结构 设计 


系统 总 体 结构 设计 是 要 根据 系统 分 析 的 要 求 和 组 织 的 实际 情况 对 新 系统 的 总 体 结构 形式 
和 可 利用 的 资源 进行 大 致 设计 ， 这 是 一 种 宏观 、 总 体 上 的 设计 和 规划 。 下 面 介绍 系统 总 体 设计 
的 主要 内 容 。 

1. 系统 结构 设计 原则 


为 保证 总 体 结构 设计 顺利 完成 ， 应 遵循 以 下 几 条 原则 。 

(1) 分 解 -协调 原则 。 整 个 系统 是 一 个 整体 ， 具 有 整体 目的 和 功能 ， 但 这 些 目的 和 功能 的 实 
现 又 是 由 相互 联系 的 各 个 组 成 部 分 共同 工作 的 结果 。 解 决 复杂 问题 的 一 个 很 重要 的 原则 就 是 把 
它 分 解 成 多 个 小 问题 分 别处 理 ， 在 处 理 过 程 中 根据 系统 总 体 要 求 协调 各 部 门 的 关系 。 

(2) 自 项 向 下 的 原则 。 首 先 抓 住 系统 总 的 功能 目的 ， 然 后 逐 层 分 解 ， 即 先 确定 上 层 模块 的 
功能 ， 再 确定 下 层 模块 的 功能 。 

(3) 信息 隐蔽 、 抽 象 的 原则 。 上 层 模块 只 规定 下 层 模块 做 什么 和 所 属 模块 间 的 协调 关系 ， 
但 不 规定 怎么 做 ， 以 保证 各 模块 的 相对 独立 性 和 内 部 结构 的 合理 性 ， 使 得 模块 与 模块 之 间 层 次 
分 明 ， 易 于 理解 、 实 施 和 维护 。 

(4) 一 致 性 原则 。 要 保证 整个 软件 设计 过 程 中 具有 统一 的 规范 、 统 一 的 标准 和 统一 的 文件 
模式 等 。 

(5) 明确 性 原则 。 每 个 模块 必须 功能 明确 、 接 口 明 确 ， 消 除 多 重 功能 和 无 用 接口 。 

(6) 模块 之 间 的 耦合 尽 可 能 小 ， 模 块 的 内 聚 度 尽 可 能 高 。 

(7) 模块 的 扇 入 系数 和 扇 出 系数 要 合理 。 一 个 模块 直接 调用 其 他 模块 的 个 数 称 为 模块 的 扇 
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出 系数 ， 反 之 ， 一 个 模块 被 其 他 模块 调用 时 ， 直 接 调 用 它 的 模块 个 数 称 为 模块 的 扇 入 系数 。 模 
块 的 扇 入 、 扇 出 系数 必须 适当 。 经 验 表明 ， 一 个 设计 得 好 的 系统 的 平均 扇 入 、 扇 出 系数 通常 是 
3 或 4， 一 般 不 应 超过 7， 和 否则 会 引起 出 错 概率 的 增 大 。 但 菜单 调用 型 模块 的 扇 入 与 扇 出 系数 可 
以 大 一 些 ， 公 用 模块 的 扇 入 系数 可 以 大 一 些 。 

(8) 模块 的 规模 适当 。 过 大 的 模块 常常 使 系统 分 解 得 不 充分 ， 其 内 部 可 能 包含 了 若干 部 分 
的 功能 ， 因 此 有 必要 进一步 把 原 有 的 模块 分 解 成 若干 功能 尽 可 能 单一 的 模块 。 但 分 解 也 必须 适 
度 ， 因 为 过 小 的 模块 有 可 能 降低 模块 的 独立 性 ， 造 成 系统 接口 的 复杂 性 。 


2. 子 系统 划分 


1) 子 系统 划分 的 原则 

为 了 便于 今后 的 系统 开发 和 系统 运行 ， 子 系统 的 划分 应 遵循 以 下 几 点 原则 。 

(1) 子 系统 要 具有 相对 独立 性 。 子 系统 的 划分 ， 必 须 使 得 子 系统 的 内 部 功能 、 信 息 等 各 方 
面 的 凝聚 性 较 好 。 子 系统 独立 可 以 减少 子 系统 间 的 相互 影响 , 有 利于 多 人 分 工 开发 不 同 的 模块 ， 
从 而 提高 软件 产品 的 生产 率 ， 保 证 软件 产品 的 质量 ， 同 时 也 增强 了 系统 的 可 维护 性 和 适应 性 。 

(2) 子 系统 之 间 数 据 的 依赖 性 尽量 小 。 子 系统 之 间 的 联系 要 尽量 减少 ， 接 口 要 简单 明确 。 
一 个 内 部 联系 强 的 子 系统 对 外 部 的 联系 必然 很 少 ， 所 以 在 划分 的 时 候 ， 应 将 联系 较 多 者 列 入 子 
系统 内 部 ， 而 剩余 的 一 些 分 散 、 跨 度 比较 大 的 联系 ， 就 成 为 这 些 子 系统 间 的 联系 和 接口 。 这 样 
划分 的 子 系统 ， 将 来 调试 、 维 护 和 运行 都 是 非常 方便 的 。 

(3) 子 系统 划分 的 结果 应 使 数据 元 余 较 小 。 如 果 把 相关 的 功能 数据 分 布 到 各 个 不 同 的 子 系 
统 中 ， 则 会 有 大 量 的 原始 数据 需要 调用 ， 大 量 的 中 间 结 果 需 要 保存 和 传递 ， 大 量 的 计算 工作 将 
要 重复 进行 ， 从 而 使 得 程序 结构 紊乱 ， 数 据 元 余 ， 不 仅 给 编码 带 来 很 大 的 困难 ， 而 且 系 统 的 工 
作 效 率 也 大 大 降低 。 

(4) 子 系统 的 设置 应 考虑 今后 管理 发 展 的 需要 。 子 系统 的 设置 仅 依靠 上 述 系统 分 析 的 结构 
是 不 够 的 ， 因 为 现存 的 系统 由 于 各 种 原因 ， 很 可 能 没有 考虑 到 一 些 高 层次 管理 决策 的 要 求 。 

(5) 子 系统 的 划分 应 便于 系统 分 阶段 实现 。 信 息 系 统 的 开发 是 一 项 较 大 的 工程 ， 它 的 实现 
一 般 要 分 批 进行 ， 所 以 子 系统 的 划分 应 能 适应 这 种 分 期 分 批 的 实施 。 另 外 ， 子 系统 的 划分 还 必 
须 兼顾 组 织 结构 的 要 求 。 

(6) 子 系统 的 划分 应 考虑 到 各 类 资源 的 充分 利用 。 一 个 适当 的 子 系统 划分 应 该 既 考 虑 有 利 
于 各 种 设备 资源 在 开发 过 程 中 的 搭配 使 用 ， 又 考虑 到 各 类 信息 资源 的 合理 分 布 和 充分 使 用 ， 以 
减少 系统 对 网 络 资源 的 过 分 依赖 ， 减 少 输入 、 输 出 和 通信 等 设备 压力 。 

2) 子 系 统 结构 设计 

子 系统 结构 设计 的 任务 是 确定 划分 后 的 子 系统 模块 结构 ， 并 画 出 模块 结构 图 。 在 这 个 过 程 
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中 必须 考虑 以 下 几 个 问题 。 

(1) 每 个 子 系统 如 何 划分 成 多 个 模块 。 

(2) 如 何 确定 子 系统 之 间 、 模 块 之 间 传 送 的 数据 及 其 调用 关系 。 
(3) 如 何 评价 并 改进 模块 结构 的 质量 。 

(4) 如 何 从 数据 流 图 导出 模块 结构 图 。 


3. 系统 模块 结构 设计 


1) 模块 的 概念 

模块 是 组 成 系统 的 基本 单位 ， 它 的 特点 是 可 以 组 合 、 分 解 和 更 换 。 系 统 中 的 任何 一 个 处 理 
功能 都 可 以 看 成 是 一 个 模块 。 根据 功能 具体 化 程度 的 不 同 , 模块 可 以 分 为 逻辑 模块 和 物理 模块 。 
在 系统 逻辑 模型 中 定义 的 处 理 功 能 可 视 为 逻辑 模块 。 物 理 模 块 是 逻辑 模块 的 具体 化 ， 可 以 是 一 
个 计算 机 程序 、 子 程序 或 若干 条 程序 语句 ， 也 可 以 是 人 工 过 程 的 某 项 具体 工作 。 

一 个 模块 应 具备 以 下 4 个 要 素 。 

(1) 输入 和 输出 。 模 块 的 输入 来 源 和 输出 去 向 都 是 同一 个 调用 者 ， 即 一 个 模块 从 调用 者 那 
里 取得 输入 ， 进 行 加 工 后 再 把 输出 返回 给 调用 者 。 

(2) 处 理 功能 。 指 模块 把 输入 转换 成 输出 所 做 的 工作 。 

(3) 内 部 数据 。 指 仅 供 该 模块 本 身 引 用 的 数据 。 

(4) 程序 代码 。 指 用 来 实现 模块 功能 的 程序 。 

前 两 个 要 素 是 模块 外 部 特性 ， 反 映 了 模块 的 外 貌 。 后 两 个 要 素 是 模块 的 内 部 特性 。 在 结构 
化 设计 中 ， 主 要 考虑 的 是 模块 的 外 部 特性 ， 对 其 内 部 特性 只 做 必要 了 解 ， 具 体 的 实现 将 在 系统 
实施 阶段 完成 。 

2) 模块 结构 图 

为 了 保证 系统 设计 工作 的 顺利 进行 ， 结 构 设计 应 遵循 以 下 原则 。 

(1) 所 划分 的 模块 其 内 部 的 凝聚 性 要 强 , 模块 之 间 的 联系 要 少 , 即 模块 具有 较 强 的 独立 性 。 

(2) 模块 之 间 的 连接 只 能 存在 上 下 级 之 间 的 调用 关系 ， 不 能 有 同 级 之 间 的 横向 联系 。 

(3) 整个 系统 呈 树 状 结构 ， 不 允许 网 状 结构 或 交叉 调用 关系 出 现 。 

(4) 所 有 模块 〈 包 括 后 继 卫 O 图 ) 都 必须 严格 地 分 类 编码 并 建立 归档 文件 。 

模块 结构 图 主要 关心 的 是 模块 的 外 部 属性 ， 即 上 下 级 模块 、 同 级 模块 之 间 的 数据 传递 和 调 
用 关系 ， 并 不 关心 模块 的 内 部 。 

模块 结构 图 是 结构 化 设计 中 描述 系统 结构 的 图 形 工具 。 作 为 一 种 文档 ， 它 必须 严格 地 定义 
模块 的 名 字 、 功 能 和 接口 ， 同 时 还 应 当 在 模块 结构 图 上 反映 出 结构 化 设计 的 思想 。 模 块 结构 图 
由 模块 、 调 用 、 数 据 、 控 制 信息 和 转 接 符号 5 种 基本 符号 组 成 ， 如 图 6-4 所 示 ， 说 明 如 下 。 


E21 攻 
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模块 调用 数据 控制 信息 转 接 符号 


图 6-4 模块 结构 图 的 基本 符号 


模块 。 这 里 所 说 的 模块 通常 是 指 用 一 个 名 字 就 可 以 调用 的 一 段 程序 语句 。 在 长 方形 中 
间 标 上 能 反映 模块 处 理 功能 的 模块 名 字 。 

调用 。 第 头 总 是 由 调用 模块 指向 被 调用 模块 ， 但 是 应 该 理解 被 调用 模块 执行 后 又 返回 
到 调用 模块 。 


如 果 一 个 模块 是 否 调用 一 个 从 属 模 块 ， 取决 于 调用 模块 内 部 的 判断 条 件 ， 则 该 调用 模块 间 
的 判断 调用 采用 萎 形 符号 表示 。 如 果 一 个 模块 通过 其 内 部 的 循环 功能 来 循环 调用 一 个 或 多 个 从 
属 模块 ， 则 该 调用 称 为 循环 调用 ， 用 弧 形 第 头 表示 。 判 断 调用 和 循环 调用 的 表示 方法 如 图 6-5 


所 示 。 


工 元 


(a) 调用 (b) 判断 调用 (ec) 循环 调用 


图 6-5 模块 调用 示例 


数据 。 当 一 个 模块 调用 另 一 个 模块 时 , 调用 模块 可 以 把 数据 传送 到 被 调用 模块 供 处 理 ， 
而 被 调用 模块 又 可 以 将 处 理 的 结构 送 回 到 被 调用 模块 。 在 模块 之 间 传送 的 数据 ， 使 用 
与 调用 箭头 平行 的 带 空心 圆 的 箭头 表示 ， 并 在 旁边 标 上 数据 名 。 图 6-6(a) 表示 模块 
A 调用 模块 B 时 ，A 将 数据 x、y 传送 给 B，B 将 处 理 结果 数据 = 返回 给 A。 

控制 信息 。 在 模块 间 有 时 必须 传送 某 些 控制 信息 。 例 如 ， 数 据 输入 完成 后 给 出 的 结束 
标志 ， 文 件 读 到 末尾 时 所 产生 的 文件 结束 标志 等 。 控 制 信息 与 数据 的 主要 区 别 是 前 者 
只 反映 数据 的 某 种 状态 ， 不 必 进 行 处 理 。 图 6-6 (b) 中 的 “无 此 职工 ”就 是 用 来 表示 
送 来 的 职工 号 有 误 的 控制 信息 。 

转 接 符 号 。 当 模块 结构 图 在 一 张 纸 上 画 不 下 ， 需 要 转 接 到 另 一 张 纸 上 ， 或 者 为 了 避免 
图 上 线条 交叉 时 ， 都 可 以 使 用 转 接 符号 ， 圆 圈 内 加 上 标号 ， 如 图 6-7 所 示 。 
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A 查 职工 简历 
和 l 。 | 上 简历 数据 
4 | tb 无 此 职工 
B 读 人 事 文件 
(a) (b) 
图 6-6 模块 间 的 数据 传递 图 6-7 转 接 符号 的 使 用 


4. 数据 存储 设计 


信息 系统 的 主要 任务 是 从 大 量 的 数据 中 获得 管理 所 需要 的 信息 ,这 就 必须 存储 和 管理 大 量 
的 数据 。 因此， 建立 一 个 良好 的 数据 组 织 结构 和 数据 库 ， 使 整个 系统 都 可 以 迅速 、 方 便 、 准 确 
地 调用 和 管理 所 需 的 数据 ， 是 衡量 信息 系统 开发 工作 好 坏 的 主要 指标 之 一 。 

数据 结构 组 织 和 数据 库 或 文件 设计 ， 就 是 要 根据 数据 的 不 同 用 途 、 使 用 要 求 、 统 计 渠 道 和 
安全 保密 性 等 来 决定 数据 的 整体 组 织 形式 、 表 或 文件 的 形式 ， 以 及 决定 数据 的 结构 、 类 别 、 载 
体 、 组 织 方式 、 保 密级 别 等 一 系列 的 问题 。 

一 个 好 的 数据 结构 和 数据 库 应 该 充分 满足 组 织 的 各 级 管理 要 求 ， 同 时 还 应 该 使 后 继 系统 的 
开发 工人 方便、 快捷、 系统 开销 《如 占用 空间 、 网 络 传输 频 度 、 磁 盘 或 光盘 读 写 次 数 等 ) 小 、 
易于 管理 和 维护 。 有 关 数 据 库 及 数据 库 设计 的 相关 内 容 可 参见 本 书 第 7 章 。 

在 建立 了 数据 的 整体 结构 之 后 ， 剩 下 的 就 是 要 确定 数据 的 资源 分 布 和 安全 保密 性 。 其 中 ， 
数据 资源 的 分 布 是 针对 分 布 数据 库 系 统 而 言 的 ， 而 安全 保密 属性 的 定义 则 是 针对 某 些 特殊 信 
息 ， 例 如 财务 数据 等 而 言 的 。 

(1) 数据 资源 分 布 。 如 果 所 规划 和 设计 的 系统 是 在 网 络 环境 之 下 ， 那 么 数据 库 设 计 必须 考 
虑 整个 数据 资源 在 网 络 各 结 点 《包括 网 络 服务 器 ) 上 的 分 配 问 题 。 

(2) 数据 的 安全 保密 。 一 般 数据 库 软 件 都 提供 定义 数据 安全 保密 性 的 基本 功能 。 系 统 所 提 
供 的 安全 保密 功能 一 般 有 8 个 等 级 (0 一 7 级 )，4 种 不 同方 式 〈 只 读 、 只 写 、 删 除 、 修 改 )， 而 
且 允 许 用 户 利用 这 8 个 等 级 的 4 种 方式 对 每 一 个 表 自 由 地 进行 定义 。 


6.1.4 系统 文档 
信息 系统 的 文档 是 系统 建设 过 程 的 “痕迹 ”， 是 系统 维护 人 员 的 指南 ， 是 开发 人 员 与 用 户 
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交流 的 工具 。 规 范 的 文档 意味 着 系统 是 按照 工程 化 开发 的 ， 意 味 着 信息 系统 的 质量 有 了 形式 上 
的 保障 。 文 档 的 欠缺 、 文 档 的 随意 性 和 文档 的 不 规范 , 极 有 可 能 导致 原来 的 开发 人 员 流 动 以 后 ， 
系统 不 可 维护 、 不 可 升级 ， 变 成 了 一 个 没有 扩展 性 、 没 有 生命 力 的 系统 。 

信息 系统 的 文档 不 仅 包括 应 用 软件 开发 过 程 中 产生 的 文档 ， 还 包括 硬件 采购 和 网 络 设计 中 
形成 的 文档 ;不 仅 包括 上 述 有 一 定格 式 要求 的 规范 文档 ， 也 包括 系统 建设 过 程 中 的 各 种 来 往 文 
件 、 会 议 纪要 、 会 计 单据 等 资料 形成 的 不 规范 文档 ， 后 者 是 建设 各 方 谈判 甚至 索赔 的 重要 依据 ; 
不 仅 包括 系统 实施 记录 ， 也 包括 程序 资料 和 培训 教程 等 。 

对 文档 在 系统 开发 人 员 、 项 目 管理 人 员 、 系 统 维护 人 员 、 系 统 评价 人 员 以 及 用 户 之 间 的 多 
种 作用 总 结 如 下 。 

(1) 用 户 与 系统 分 析 人 员 在 系统 规划 和 系统 分 析 阶 段 通 过 文档 进行 沟通 。 这 里 的 文档 主要 
包括 可 行 性 研究 报告 、 总 体 规划 报告 、 系 统 开 发 合同 和 系统 方案 说 明 书 等 。 有 了 文档 ， 用 户 就 
能 依次 对 系统 分 析 师 是 否 正确 理解 了 系统 的 需求 进行 评价 ， 如 不 正确 ， 可 以 在 已 有 文档 的 基础 
上 进行 修正 。 

(2) 系统 开发 人 员 与 项 目 管理 人 员 通 过 文档 在 项 目 期 内 进行 沟通 。 这 里 的 文档 主要 有 系统 
开发 计划 《〈 包 括 工作 任务 分 解 表 、PERT 图 、 甘 特 图 和 预算 分 配 表 等 )、 系 统 开发 月 报 以 及 系统 
开发 总 结 报告 等 项 目 管理 文件 。 有 了 这 些 文档 ， 不 同 阶段 之 间 的 开发 人 员 就 可 以 进行 工作 的 顺 
利 交 接 ， 同 时 还 能 降低 因为 人 员 流 动 带 来 的 风险 ， 因 为 接替 人 员 可 以 根据 文档 理解 前 面 人 员 的 
设计 思路 或 开发 思路 。 

(3) 系统 测试 人 员 与 系统 开发 人 员 通 过 文档 进行 沟通 。 系 统 测试 人 员 可 以 根据 系统 方案 说 
明 书 、 系 统 开发 合同 、 系 统 设计 说 明 书 和 测试 计划 等 文档 对 系统 开发 人 员 所 开发 的 系统 进行 测 
试 。 系 统 测试 人 员 再 将 评估 结果 撰写 成 系统 测试 报告 。 

(4) 系统 开发 人 员 与 用 户 在 系统 运行 期 间 进 行 沟通 。 用 户 通 过 系统 开发 人 员 撰 写 的 文档 运 
行 系统 。 这 里 的 文档 主要 是 用 户 手册 和 操作 指南 。 

(5) 系统 开发 人 员 与 系统 维护 人 员 通 过 文档 进行 沟通 。 这 里 的 文档 主要 有 系统 设计 说 明 书 
和 系统 开发 总 结 报告 。 有 的 开发 总 结 报告 写 得 很 详细 ， 分 为 研制 报告 、 技 术 报 告 和 技术 手册 3 
个 文档 ， 其 中 的 技术 手册 记录 了 系统 开发 过 程 中 的 各 种 主要 技术 细节 。 这 样 ， 即 使 系统 维护 人 
员 不 是 原来 的 开发 人 员 ， 也 可 以 在 这 些 文档 的 基础 上 进行 系统 的 维护 与 升级 。 

(6) 用 户 与 维修 人 员 在 运行 维护 期 间 进行 沟通 。 用 户 在 使 用 信息 系统 的 过 程 中 ， 将 运行 过 
程 中 的 问题 进行 记载 ， 形 成 系统 运行 报告 和 维护 修改 建议 。 系 统 维护 人 员 根 据 维护 修改 建议 以 
及 系统 开发 人 员 留 下 的 技术 手册 等 文档 对 系统 进行 维护 和 升级 。 
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6.2 结构 化 分 析 方 法 


结构 化 分 析 与 设计 方法 是 一 种 面向 数据 流 的 传统 软件 开发 方法 , 它 以 数据 流 为 中 心 构建 软 
件 的 分 析 模型 和 设计 模型 .结构 化 分 析 (Structured Analysis, SA)、 结 构 化 设计 (Structured Design， 
SD) 和 结构 化 程序 设计 (Structured Programming Design，SPD) 构成 了 完整 的 结构 化 方法 。 


6.2.1 结构 化 分 析 方 法 概述 


抽象 和 分 解 是 处 理 任何 复杂 问题 的 两 个 基本 手段 。 

抽象 是 指 忽略 一 个 问题 中 与 当前 目标 无 关 的 那些 方面 ， 以 便 更 充分 地 关注 与 当前 目标 有 关 
的 方面 。 对 于 一 个 复杂 的 问题 ， 人 们 很 难 一 下 子 考虑 问题 的 所 有 方面 和 全 部 细节 ， 通 常 可 以 把 
一 个 大 问题 分 解 成 若干 个 小 问题 ， 将 每 个 小 问题 再 分 解 成 若干 个 更 小 的 问题 ， 经 过 多 次 逐 层 分 
解 ， 每 个 最 底层 的 问题 都 是 足够 简单 、 容 易 解 决 的 ， 于 是 复杂 的 问题 也 就 迎刃而解 了 。 这 个 过 
程 就 是 分 解 的 过 程 。 

结构 化 方法 就 是 采用 这 种 自 顶 向 下 逐 层 分 解 的 思想 进行 分 析 建 模 的 。 自 项 向 下 逐 层 分 解 充 
分 体现 了 分 解 和 抽象 的 原则 。 随 着 分 解 层次 的 增加 ， 抽 象 的 级 别 也 越 来 越 低 ， 即 越 来 接近 问题 
的 解 。 自 项 向 下 的 过 程 是 分 解 的 过 程 ， 自 底 向 上 的 过 程 是 抽象 的 过 程 。 

结构 化 方法 的 分 析 结果 由 以 下 几 部 分 组 成 : 一 套 分 层 的 数据 流 图 、 一 本 数据 词典 、 一 组 小 
说 明 (也 称 加 工 迪 辑 说 明 )、 补 充 材 料 。 


6.2.2 ”数据 流 图 


数据 流 图 也 称 数据 流程 图 (Data Flow Diagram，DFD)， 它 是 一 种 便于 用 户 理解 、 分 析 系 
统 数据 流程 的 图 形 工 具 。 它 摆脱 了 系统 的 物理 内 容 ， 精 确 地 在 逻辑 上 描述 系统 的 功能 、 输 入 、 
输出 和 数据 存储 等 ， 是 系统 逻辑 模型 的 重要 组 成 部 分 。 


1. 数据 流 图 的 基本 图 形 元 素 


数据 流 图 中 的 基本 图 形 元 素 包 括 数据 流 (Data Flow)、 加工 (Process)、 数 据 存储 (Data Store) 
和 外 部 实体 (External Agent)。 其 中 ， 数 据 流 、 加 工 和 数据 存储 用 于 构建 软件 系统 内 部 的 数据 
处 理 模型 ， 外 部 实体 表示 存在 于 系统 之 外 的 对 象 ， 用 来 帮助 用 户 理解 系统 数据 的 来 源 和 去 向 。 
DFD 的 基本 图 形 元 素 如 图 6-8 所 示 。 
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(a) 外 部 实体 (External Agent) (Cb) 加 工 〈Process) 
或 
(c) 数据 存储 (DataStore) (d) 数据 流 (Data Flow) 


图 6-8 DFD 的 基本 图 形 元 素 

1) 数据 流 

数据 流 由 一 组 固定 成 分 的 数据 组 成 ， 表 示 数 据 的 流向 。 在 DFD 中 ， 数 据 流 的 流向 可 以 有 以 下 
几 种 : 从 一 个 加 工 流向 另 一 个 加 工 ， 从 加 工 流向 数据 存储 《〈 写 ); 从 数据 存储 流向 加 工 〈 读 ); 
从 外 部 实体 流向 加 工 〈 输 入 ); 从 加 工 流向 外 部 实体 (输出 )。 

DFD 中 的 每 个 数据 流 用 一 个 定义 明确 的 名 字 表 示 。 除 了 流向 数据 存储 或 从 数据 存储 流出 的 
数据 流 不 必 命名 外 ， 每 个 数据 流 都 必须 有 一 个 合适 的 名 字 ， 以 反映 该 数据 流 的 含义 。 

值得 注意 的 是 ，DFD 中 描述 的 是 数据 流 ， 而 不 是 控制 流 。 

数据 流 或 者 由 具体 的 数据 属性 (也 称 为 数据 结构 》 构 成， 或 者 由 其 他 数据 流 构 成 。 组 合 数 
据 流 是 由 其 他 数据 流 构 成 的 数据 流 ， 它 们 用 于 在 高 层 的 数据 流 图 中 组 合 相 似 的 数据 流 ， 以 使 数 
据 流 图 更 便于 阅读 。 

2) 加 工 

加 工 描 述 了 输入 数据 流 到 输出 数据 流 之 间 的 变换 ， 也 就 是 输入 数据 流 经 过 什么 处 理 后 变 成 
了 输出 数据 流 。 每 个 加 工 都 有 一 个 名 字 和 编号 。 编 号 能 反映 出 该 加 工 位 于 分 层 DFD 中 的 哪个 层次 
和 哪 张 图 中 ， 也 能 够 看 出 它 是 哪个 加 工分 解 出 来 的 子 加 工 。 

一 个 加 工 可 以 有 多 个 输入 数据 流 和 多 个 输出 数据 流 ， 但 至 少 有 一 个 输入 数据 流 和 一 个 输出 
数据 流 。 数 据 流 图 中 常见 的 3 种 错误 如 图 6-9 所 示 。 

加 工 3.1.2 有 输入 但 是 没有 输出 ， 我 们 称 之 为 “黑洞 ”。 因 为 数据 输入 到 过 程 ， 然 后 就 消失 
了 。 在 大 多 数 情况 下 ， 建 模 人 员 只 是 忘 了 输出 。 

加 工 3.1.3 有 输出 但 没有 输入 。 在 这 种 情况 下 ， 输 入 流 似乎 被 忘记 了 。 

加 工 3.1.1 中 输入 不 足以 产生 输出 ， 我 们 称 之 为 “ 灰 洞 ” 这 有 几 种 可 能 的 原因 : 一 个 错误 
的 命名 过 程 ;， 错误 命名 的 输入 或 输出 ; 不 完全 的 事实 。 灰 洞 是 最 常见 的 错误 ， 也 是 最 使 人 为 难 
的 错误 。 一 旦 数据 流 图 交 给 了 程序 员 ， 到 一 个 加 工 的 输入 数据 流 必 须 足 以 产生 输出 数据 流 。 

3) 数据 存储 

数据 存储 用 来 存储 数据 。 通 常 ， 一 个 流入 加 工 的 数据 流 经 过 加 工 处 理 后 就 消失 了 ， 而 它 的 
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某 些 数据 〈 或 全 部 数据 ) 可 能 被 加 工 成 输出 数据 流 ， 流 向 其 他 加 工 或 外 部 实体 。 除 此 之 外 ， 在 
软件 系统 中 还 常常 要 把 某 些 信息 保存 下 来 以 供 以 后 使 用 ， 这 时 可 以 使 用 数据 存储 。 例 如 ， 在 考 
务 处 理 系统 中 ， 报 名 时 产生 的 考生 名 册 要 随 着 报名 的 过 程 不 断 补充 ， 在 统计 成 绩 和 制作 考生 通 
知 书 时 还 要 使 用 考生 名 册 的 相关 信息 。 因 此 ， 考 生 和 名册 可 以 作为 数据 存储 存在 ， 以 保存 相关 的 
考生 信息 。 


会 员 应 用 


冻结 账号 通知 


图 6-9 数据 流 图 中 的 常见 错误 


每 个 数据 存储 都 有 一 个 定义 明确 的 名 字 标 识 。 可 以 有 数据 流 流 入 数据 存储 ， 表 示 数 据 的 写 
入 操作 ; 也 可 以 有 数据 流 从 数据 存储 流出 ， 表 示 数 据 的 读 操作 ; 还 可 以 用 双向 箭头 的 数据 流 指 
向 数据 存储 ， 表 示 对 数据 的 修改 。 

这 里 要 说 明 的 是 ，DFD 中 的 数据 存储 在 具体 实现 时 可 以 用 文件 系统 实现 ， 也 可 以 用 数据 库 
系统 实现 。 数 据 存储 的 存储 介质 可 以 是 磁盘 、 磁 带 或 其 他 存储 介质 。 

4) 外 部 实体 〈 外 部 主体 ) 

外 部 实体 是 指 存在 于 软件 系统 之 外 的 人 员 或 组 织 ， 它 指出 系统 所 需 数据 的 发 源 地 〈 源 ) 和 
系统 所 产生 的 数据 的 归宿 地 〈 宿 )。 例 如 ， 对 于 一 个 考 务 处 理 系统 而 言 ， 考 生 向 系统 提供 报名 
单 〈 输 入 数据 流 )， 所 以 考生 是 考 务 处 理 系统 的 一 个 源 ; 而 考 务 处 理 系统 要 将 考试 成 绩 的 统计 
分 析 表 〈 输 出 数据 流 ) 传递 给 考试 中 心 ， 所 以 考试 中 心 是 该 系统 的 一 个 宿 。 

在 许多 系统 中 ， 某 个 源 和 某 个 宿 可 以 是 同一 个 人 员 或 组 织 ， 此 时 ,在 DFD 中 可 以 用 同一 个 
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符号 表示 。 考 生 向 系统 提供 报名 单 ， 而 系统 向 考生 送出 准 考证 ， 所 以 在 考 务 处 理 系统 中 ， 考 生 
既是 源 又 是 宿 。 

源 和 宿 采用 相同 的 图 形 符号 表示 ， 当 数据 流 从 该 符号 流出 时 ， 表 示 它 是 源 ， 当 数据 流 流向 
该 符号 时 ， 表 示 它 是 宿 ， 当 两 者 省 有 时 ， 表 示 它 既是 源 又 是 宿 。 


2. 数据 流 图 的 扩充 符号 


在 DFD 中 , 一 个 加 工 可 以 有 多 个 输入 数据 流 和 多 个 输出 数据 流 , 此 时 可 以 加 上 一 些 扩充 符 
号 来 描述 多 个 数据 流 之 间 的 关系 。 

1) 星 号 (*) 

星 号 表示 数据 流 之 间 存 在 “与 ”关系 。 如 果 是 输入 流 则 表示 所 有 输入 数据 流 全 部 到 达 后 才 
能 进行 加 工 处 理 ， 如 果 是 输出 流 则 表示 加 工 结束 将 同时 产生 所 有 的 输出 数据 流 。 

2) 加 号 (+) 

加 号 表示 数据 流 之 间 存 在 “或 ”关系 。 如 果 是 输入 流 则 表示 其 中 任何 一 个 输入 数据 流 到 达 
后 就 能 进行 加 工 处 理 ， 如 果 是 输入 流 则 表示 加 工 处 理 的 结果 是 至 少 产生 其 中 一 个 输出 数据 流 。 

3) 异 或 (@) 

异 或 表示 数据 流 之 间 存 在 “ 互 斥 ”关系 。 如 果 是 输入 流 则 表示 当 且 仅 当 其 中 一 个 输入 流 到 
达 后 才能 进行 加 工 处 理 ， 如 果 是 输出 流 则 表示 加 工 处 理 的 结果 是 仅 产生 这 些 输出 数据 流 中 的 


一 个 。 


3. 数据 流 图 的 层次 结构 


从 原理 上 讲 ， 只 要 纸 足 够 大 ， 一 个 软件 系统 的 分 析 模 型 就 可 以 画 在 一 张 纸 上 。 然 而 ， 一 个 
复杂 的 软件 系统 可 能 涉及 上 百 个 加 工 和 上 百 个 数据 流 ， 甚 至 更 多 。 如 果 将 它们 画 在 一 张 图 上 ， 
则 会 十 分 复杂 ， 不 易 阅 读 ， 也 不 易 理 解 。 

根据 自 项 向 下 逐 层 分 解 的 思想 ， 可 以 将 数据 流 图 按照 层次 结构 来 绘制 ， 每 张 图 中 的 加 工 个 
数 可 大 致 控制 在 “7 加 减 2” 的 范围 内 ， 从 而 构成 一 套 分 层 数 据 流 图 。 

1) 层次 结构 

分 层 数 据 流 图 的 项 层 只 有 一 张 图 ， 其 中 只 有 一 个 加 工 ， 代 表 整 个 软件 系统 ， 该 加 工 描述 了 
软件 系统 与 外 界 之 间 的 数据 流 ， 称 为 项 层 图 。 

顶层 图 中 的 加 工 〈 即 系统 ) 经 分 解 后 的 图 称 为 0 层 图 ， 也 只 有 一 张 。 处 于 分 层 数据 流 图 最 
底层 的 图 称 为 底层 图 ， 在 底层 图 中 ， 所 有 的 加 工 不 再 进行 分 解 。 分 层 数据 流 图 中 的 其 他 图 称 为 
中 间 层 ， 其 中 至 少 有 一 个 加 工 〈 也 可 以 是 所 有 加 工 ) 被 分 解 成 一 张 子 图 。 在 整套 分 层 数 据 流 图 
中 ， 凡 是 不 再 分 解 成 子 图 的 加 工 称 为 基本 加 工 。 

2) 图 和 加 工 的 编号 

首先 介绍 父 图 和 子 图 的 概念 。 
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如 果 某 图 〈 记 为 4) 中 的 某 一 个 加 工分 解 成 一 张 子 图 ( 记 为 B)， 则 称 4 是 B 的 父 图 ， B 是 
4 的 子 图 。 若 父 图 中 有 n 个 加 工 ， 则 它 可 以 有 0~n 张 子 图 ， 但 每 张 子 图 只 对 应 一 张 父 图 。 

为 了 方便 对 图 进行 管理 和 查找 ， 可 以 采用 下 列 方式 对 DFD 中 的 图 和 加 工 编号 。 

@ 顶层 图 中 只 有 一 个 加 工 〈 代 表 整 个 软件 系统 )， 该 加 工 不 必 编 号 。 

@ 0 层 图 中 的 加 工 编号 分 别 为 1、2、3…。 

图 子 图 号 就 是 父 图 中 被 分 解 的 加 工 号 。 

@ 对 于 子 图 中 加 工 的 编号 , 若 父 图 中 的 加 工 号 为 x 的 加 工分 解 成 某 一 子 图 , 则 该 子 图 中 的 
加 工 编号 分 别 为 x1、x.2、x.3…。 


4. 分 层 数据 流 图 的 画 法 


下 面 以 某 考 务 处 理 系统 为 例 介 绍 分 层 数据 流 图 的 画 法 。 

考 务 处 理 系统 的 功能 需求 如 下 。 

@ 对 考生 送 来 的 报名 单 进行 检查 。 

@ 对 合格 的 报名 单 编 好 准 考证 号 后 将 准 考证 送 给 考生 ， 并 将 汇总 后 的 考生 名 单 送 给 阅 


@ 对 阅卷 站 送 来 的 成 绩 清单 进行 检查 ， 并 根据 考试 中 心 指 定 的 合格 标准 审定 合格 者 。 
@ 制作 考生 通知 单 〈 内 含 成 绩 合格 /不 合格 标志 ) 送 给 考生 。 
@ 按 地 区 、 年 龄 、 文 化 程度 、 职 业 和 考试 级 别 等 进行 成 绩 分 类 统计 和 试题 难度 分 析 ， 产 
生 统 计 分 析 表 。 

部 分 数据 流 的 组 成 如 下 。 

报名 单 = 地 区 + 序号 + 姓名 + 文化 程度 + 职业 + 考试 级 别 + 通信 地 址 

正式 报名 单 = 准 考证 号 + 报名 单 

准 考证 = 地 区 + 序号 + 姓名 + 准 考证 号 + 考试 级 别 + 考场 

考生 名 单 = { 准 考 证 号 + 考试 级 别 } (其 中 ，{w} 表 示 w 重复 多 次 ) 

考生 名 册 = 正式 报名 单 

统计 分 析 表 = 分 类 统计 表 + 难度 分 析 表 

考生 通知 单 = 准 考 证 号 + 姓名 + 通信 地 址 + 考试 级 别 + 考试 成 绩 + 合格 标志 

下 面 介绍 画 分 层 数 据 流 图 的 步骤 。 

1) 画 系统 的 输入 和 输出 

系统 的 输入 和 输出 用 顶层 图 来 描述 ， 即 描述 系统 从 哪些 外 部 实体 接收 数据 流 ， 以 及 系统 发 
送 数 据 流 到 哪些 外 部 实体 。 

顶层 图 只 有 一 个 加 工 , 即 待 开 发 的 软件 系统 ,顶层 图 中 的 数据 流 就 是 系统 的 输入 /输出 信息 。 
顶层 图 中 通常 没有 数据 存储 。 考 务 处 理 系统 的 顶层 图 如 图 6-10 (Ca) 所 示 。 

2) 画 系统 的 内 部 

将 顶层 图 的 加 工分 解 成 若干 个 加 工 ， 并 用 数据 流 将 这 些 加 工 连接 起 来 ， 使 得 顶层 图 中 的 输 
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不 台 格 及 名 单 A 准 考证 
报名 单 


试题 得 分 清单 加 
2 】 ( 2.4 
| 难度 分 析 分 类 统计 rr 


(d) 加 工 2 的 1 层 图 


图 6-10 考 务 处 理 系 统 分 层 数 据 流 图 
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入 数据 经 过 若干 个 加 工 处 理 后 变换 成 项 层 图 的 输出 数据 流 ， 这 张 图 称 为 0 层 图 。 从 一 个 加 工 画 
出 一 张 数 据 流 图 的 过 程 实际 上 就 是 对 这 个 加 工 的 分 解 。 

(1) 确定 加 工 。 这 里 的 加 工 指 的 是 父 图 中 某 加 工分 解 而 成 的 子 加 工 ， 可 以 采用 下 面 两 种 方 
法 来 确定 加 工 。 

Q@ 根据 功能 分 解 来 确定 加 工 。 一 个 加 工 实际 上 反映 了 系统 的 一 种 功能 ， 根 据 功 能 分 解 的 
原理 , 可 以 将 一 个 复杂 的 功能 分 解 成 若干 个 较 小 的 功能 , 每 个 较 小 的 功能 就 是 分 解 后 的 子 加 工 。 
这 种 方法 多 应 用 于 高 层 DFD 中 加 工 的 分 解 。 

@ 根据 业务 处 理 流程 确定 加 工 。 分 析 父 图 中 待 分 解 的 加 工 的 业务 处 理 流程 ， 流 程 中 的 每 
一 步 都 可 能 是 一 个 子 加 工 。 特 别 要 注意 在 业务 流程 中 数据 流 发 生变 化 或 数据 流 的 值 发 生变 化 的 
地 方 ， 应 该 存在 一 个 加 工 ， 该 加 工 将 原 数据 流 〈 作 为 该 加 工 的 输入 数据 流 ) 处 理 成 变化 后 的 数 
据 流 〈 作 为 该 加 工 的 输出 数据 流 )。 该 方法 较 多 应 用 于 低层 DFD 中 加 工 的 分 解 ， 它 能 描述 父 加 
工 中 输入 数据 流 到 输出 数据 流 之 间 的 加 工 细节 。 

(2) 确定 数据 流 。 当 用 户 把 若干 个 数据 看 作 一 个 整体 来 处 理 〈 这 些 数据 一 起 到 达 ， 一 起 加 
工 ) 时 ， 可 以 把 这 些 数据 看 成 一 个 数据 流 。 通 常 ， 实 际 工作 环境 中 的 表单 就 是 一 种 数据 流 。 

在 父 图 中 某 加 工分 解 而 成 的 子 图 中 , 父 图 中 相应 加 工 的 输入 /输出 数据 流 就 是 子 图 边界 上 的 
输入 /输出 数据 流 。 另 外 ,在 分 解 后 的 子 加 工 之 间 应 增添 一 些 新 的 数据 流 ， 这 些 数据 流 是 加 工 过 
程 中 的 中 间 数 据 (对 某 子 加 工 输入 数据 流 的 改变 )， 它 们 与 所 有 的 子 加 工 一 起 完成 了 父 图 中 相 
应 加 工 的 输入 数据 流 到 输出 数据 流 的 变换 。 如 果 某 些 中 间 数 据 需要 保存 ， 以 备 使 用 ， 那 么 可 以 
表示 为 流向 数据 存储 的 数据 流 。 

同一 个 源 或 加 工 可 以 有 多 个 数据 流 流向 另 一 个 加 工 ， 如 果 它 们 不 是 一 起 到 达 和 一 起 加 工 
的 ， 那 么 可 以 将 它们 分 成 多 个 数据 流 。 同 样 ， 同 一 个 加 工 也 可 以 有 多 个 数据 流 流向 另 一 个 加 工 
或 宿 。 

(3) 确定 数据 存储 。 在 由 父 图 中 某 加 工分 解 而 成 的 子 图 中 ， 如 果 父 图 中 该 加 工 存在 流向 数 
据 存储 的 数据 流 〈 写 操作 )， 或 者 存在 从 数据 存储 流向 该 加 工 的 数据 流 〈 读 操作 )， 则 这 种 数据 
存储 和 相关 的 数据 流 都 画 在 子 图 中 。 

在 分 解 的 子 图 中 ， 如 果 需 要 保存 某 些 中 间 数 据 ， 以 备 以 后 使 用 ， 那 么 可 以 将 这 些 数据 组 成 
一 个 新 的 文件 。 在 自 项 向 下 画 分 层 数据 流 图 时 ， 新 数据 存储 《首次 出 现 的 ) 至 少 应 有 一 个 加 工 
为 其 写 入 记录 ， 同 时 至 少 存在 另 一 个 加 工读 取 该 数据 存储 的 记录 。 

注意 ， 对 于 从 父 图 中 继承 下 来 的 数据 存储 ， 在 子 图 中 可 能 只 对 其 读 记 录 ， 或 者 写 记录 。 

(4) 确定 源 和 宿 。 通 常 在 0 层 图 和 其 他 子 图 中 不 必 画 出 源 和 宿 ， 有 时 为 了 提供 可 读 性 ， 可 
以 将 顶层 图 中 的 源 和 宿 画 在 0 层 图 中 。 

当 同 一 个 外 部 实体 (人 或 组 织 ) 既是 系统 的 源 ， 又 是 系统 的 宿 时 ， 可 以 用 同一 个 图 形 符号 
来 表示 。 为 了 画图 的 方便 ， 避 免 图 中 线 的 交叉 ， 同 一 个 源 或 宿 可 以 重复 画 在 DFD 的 不 同位 置 ， 
以 增加 可 读 性 ， 但 它们 仍 代表 同一 个 实体 。 

在 考 务 处 理 系统 的 0 层 图 中 ， 采 用 功能 分 解 方法 来 确定 加 工 。 分 析 系 统 的 需求 说 明 ， 可 知 
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系统 的 功能 主要 分 为 考试 报名 及 统计 成 绩 两 大 部 分 ， 其 中 ， 报 名 工作 在 考试 前 进行 ， 统 计 成 绩 
工作 在 考试 后 进行 。 

为 此 ， 定 义 两 个 加 工 : 登记 报名 表 和 统计 成 绩 。0 层 图 中 的 数据 流 ， 除 了 继承 顶层 图 中 的 
输入 /输出 数据 流 外 , 还 应 定义 这 两 个 加 工 之 间 的 数据 流 。 由 于 这 两 个 加 工分 别 在 考试 前 后 进行 ， 
并 不 存在 直接 关系 ， 因 此 ,“ 登 记 报名 表 ” 所 产生 的 结果 “考生 名 册 ” 应 作为 数据 存储 ， 以 便 
考试 后 由 “统计 成 绩 ” 读 取 。 考 务 处 理 系统 的 0 层 图 如 图 6-10 (b) 所 示 。 

3) 画 加 工 的 内 部 

当 DFD 中 存在 某 个 比较 复杂 的 加 工时 ， 可 以 将 它 分 解 成 一 张 DFD 子 图 。 分解 的 方法 是 将 
该 加 工 看 作 一 个 小 系统 ， 该 加 工 的 输入 /输出 数据 流 就 是 这 个 假设 的 小 系统 的 输入 /输出 数据 流 ， 
然后 采用 画 0 层 图 的 方法 画 出 该 加 工 的 子 图 。 

下 面 介绍 考 务 处 理 系统 0 层 图 中 加 工 1 的 分 解 , 这 里 根据 业务 处 理 流程 来 确定 加 工 1 的 分 
解 。 分 析 考 务 处 理 系 统 的 功能 需求 和 0 层 图 ， 将 加 工 1 分 解 成 3 个 子 加 工 : 检查 报名 表 、 编 准 
考证 号 和 登记 考生 。 加 工 1 分 解 而 成 的 子 图 如 图 6-10 〈c) 所 示 。 

采用 同样 的 方法 画 出 加 工 2 分 解 的 DFD 子 图 ， 如 图 6-10 〈d) 所 示 。 

重复 第 3) 步 的 分 解 ， 直 到 图 中 尚未 分 解 的 加 工 都 足够 简单 (也 就 是 说 ， 这 种 加 工 不 必 再 
分 解 )。 

这 里 假设 图 6-10 (c)、(d) 中 的 每 个 加 工 都 已 经 足够 简单 ， 不 需要 再 分 解 ， 该 考 务 处 理 系 
统 的 分 层 DFD 绘制 工作 结束 。 


S. 分 层 数据 流 图 的 审查 


在 分 层 数 据 流 图 画 好 后 ， 应 该 认真 检查 图 中 是 否 存在 错误 或 不 合理 (不 理想 ) 的 部 分 。 

1) 分 层 数据 流 图 的 一 致 性 和 完整 性 

分 层 数据 流 图 的 一 致 性 是 指 分 层 DFD 中 不 存在 矛盾 和 冲突 。 这 里 讲 的 完整 性 是 指 分 层 DFD 
本 身 的 完整 性 ， 即 是 否 有 遗漏 的 数据 流 、 加 工 等 元 素 。 所 以 ， 分 层 DFD 的 一 致 性 和 完整 性 实 
际 上 反映 了 图 本 身 的 正确 性 。 但 是 图 本 身 的 正确 性 并 不 意味 着 分 析 模型 的 正确 性 ， 分 析 模 型 的 
正确 性 要 根据 模型 是 否 满足 用 户 的 需求 来 判断 。 

(1) 分 层 数据 流 图 的 一 致 性 。 

@ 父 图 与 子 图 的 平衡 。 父 图 与 子 图 平衡 是 指 任何 一 张 DFD 子 图 边界 上 的 输入 /输出 数据 流 
必须 与 其 父 图 中 对 应 加 工 的 输入 /输出 数据 流 保持 一 致 。 

由 于 一 张 子 图 是 被 分 解 的 加 工 的 一 种 细 化 ， 所 以 ， 这 张 子 图 应 该 保证 可 以 画 到 父 图 中 替代 
被 分 解 的 加 工 ， 因 此 保持 父 图 与 子 图 平衡 是 理所当然 的 。 

例如 ， 图 6-11 所 示 的 父 图 与 子 图 是 不 平衡 的 。 图 6-11 (b) 是 父 图 中 加 工 2 的 子 图 ， 加 工 
2 的 输入 数据 流 有 M 和 N， 输 出 数据 流 是 7， 而 子 图 边界 上 的 输入 数据 流 是 N， 输 出 数据 流 是 
S 和 了 7， 很 显然 它们 是 不 一 致 的 。 
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(a) 父 图 (b) 子 图 
图 6-11 父 图 与 子 图 不 平衡 的 实例 


如 果 父 图 中 某 个 加 工 的 一 条 数据 流 对 应 于 子 图 中 的 几 条 数据 流 ， 而 子 图 中 组 成 这 些 数据 流 
的 数据 项 全 体 正好 等 于 父 图 中 的 这 条 数据 流 ， 那 么 它们 仍然 是 平衡 的 。 

保持 父 图 与 子 图 平衡 是 画 数据 流 的 重要 原则 。 自 项 向 下 逐 层 分 解 是 降低 问题 复杂 性 的 有 效 
途径 。 然 而 ， 如 果 只 分 别 关 注 单 张 图 的 合理 性 ， 忽 略 父 图 与 子 图 之 间 的 关系 ， 则 很 容易 造成 父 
图 与 子 图 不 平衡 的 错误 。 

@ 数据 守恒 。 数 据守 恒 包 括 两 种 情况 : 第 一 种 情况 是 指 一 个 加 工 的 所 有 输出 数据 流 中 的 
数据 必须 能 从 该 加 工 的 输入 数据 流 中 直接 获得 ， 或 者 能 通过 该 加 工 的 处 理 而 产生 。 

第 二 种 情况 是 加 工 未 使 用 其 输入 数据 流 中 的 某 些 数据 项 。 这 表明 这 些 未 用 到 的 数据 项 是 多 
余 的 ， 可 以 从 输入 数据 流 中 删 去 。 当 然 ， 这 不 一 定 就 是 错误 ， 只 表示 存在 一 些 无 用 数据 。 然 而 
这 些 无 用 的 数据 常常 隐 含 着 一 些 潜 在 的 错误 ， 如 加 工 的 功能 描述 不 完整 、 遗 漏 或 不 完整 的 输出 
数据 流 等 。 因 此 ， 在 检查 数据 守恒 时 ， 不 应 该 忽视 对 这 种 情况 的 检查 。 

@ 局 部 数据 存储 。 这 里 讨论 分 层 数据 流 图 中 的 一 个 数据 存储 应 该 画 在 哪些 DFD 中 ， 不 应 
该 画 在 哪些 DFD 中 。 

在 一 套 完整 的 分 层 DFD 中 ， 任 何 一 个 数据 存储 都 应 有 写 和 读 的 数据 流 ， 否 则 这 个 文件 就 
没有 存在 的 必要 。 除 非 这 个 数据 存储 的 建立 是 为 男 一 个 软件 系统 使 用 或 者 这 个 数据 存储 是 由 另 
一 个 软件 系统 产生 和 维护 的 。 

在 自 项 向 下 分 解 加 工 的 过 程 中 ， 如 果 某 个 加 工 需 要 保存 一 些 数据 ， 同 时 在 将 加 工 的 同一 张 
DFD 上 至 少 存在 另 一 个 加 工 需 要 读 这 些 数 据 ， 那 么 该 数据 存储 应 该 在 这 张 DFD 上 画 出 。 也 就 
是 在 一 张 DFD 中 ， 当 一 个 数据 存储 作为 多 个 加 工 之 间 的 交界 面 时 ， 该 数据 存储 应 该 画 出 。 如 
果 在 一 张 DFD 中 ,一 个 数据 存储 仅 与 一 个 加 工 进行 读 / 写 操作 ， 并 且 在 该 DFD 的 父 (祖先 ) 图 
中 未 出 现 过 该 数据 存储 ， 那 么 该 数据 存储 只 是 相应 加 工 的 内 部 文件 ， 在 这 张 DFD 中 不 应 该 画 出 。 

四 一 个 加 工 的 输出 数据 流 不 能 与 该 加 工 的 输入 数据 流 同名 。 同 一 个 加 工 的 输出 数据 流 和 


a3 
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输入 数据 流 ， 即 使 它们 的 组 成 成 分 相同 ， 仍 应 该 给 它们 取 不 同 的 名 字 ， 以 表示 它们 是 不 同 的 数 
据 流 。 但 是 允许 一 个 加 工 有 两 个 相同 的 数据 流 分 别 流向 两 个 不 同 的 加 工 。 

(2) 分 层 数据 流 图 的 完整 性 。 

@ 每 个 加 工 至 少 有 一 个 输入 数据 流 和 一 个 输出 数据 流 。 一 个 没有 输入 数据 流 或 者 没有 输 
出 数据 流 的 加 工 通常 是 没有 意义 的 。 当 出 现 这 种 情况 时 ， 常 常 意味 着 可 能 遗漏 了 某 些 输入 数据 

@ 在 整套 分 层 数 据 流 图 中 ， 每 个 数据 存储 应 至 少 有 一 个 加 工 对 其 进行 读 操作 ， 另 一 个 加 
工 对 其 进行 写 操作 。 对 于 某 一 张 DFD 来 说 ， 可 以 只 写 不 读 或 只 读 不 写 。 

@ 分 层 数 据 流 图 中 的 每 个 数据 流 和 文件 都 必须 命名 (除了 流入 或 流出 数据 存储 的 数据 
流 )， 并 保持 与 数据 字典 一 致 

@ 分 层 数 据 流 图 中 的 每 个 基本 加 工 都 应 有 一 个 加 工 规约 。 

2) 构造 分 层 DFD 时 需要 注意 的 问题 

(1) 适当 命名 。DEFD 中 的 每 个 数据 流 、 加 工 、 数 据 存储 、 外 部 实体 都 应 被 适当 地 命名 ， 名 
字 应 符合 被 命名 对 象 的 实际 含义 。 通 常 ， 数 据 流 名 可 用 名 词 或 形容 词 加 名 词 来 描述 ， 加 工 名 可 
以 用 动词 或 及 物 动词 加 宾语 来 描述 ， 数 据 存储 名 可 以 用 名 词 来 描述 ， 外 部 实体 可 以 用 实际 的 人 
员 身 份 或 组 织 的 名 称 来 命名 。 

用 户 在 命名 时 应 注意 以 下 问题 。 

@ 名 字 应 反映 整个 对 象 〈 如 数据 流 、 加 工 )， 而 不 是 只 反映 它 的 某 一 部 分 。 

@ 避免 使 用 空洞 的 、 含 义 不 清 的 名 字 ， 如 “数据 “信息 ”“ 处 理 ”“ 统 计 ” 等 。 

@ 如 果 发 现 某 个 数据 流 或 加 工 难以 命名 ， 往 往 是 DFD 分 解 不 当 的 征兆 ， 此 时 应 考虑 重新 
分 解 。 

(2) 画 数据 流 而 不 是 控制 流 。 数 据 流 图 强调 的 是 数据 流 ， 而 不 是 控制 流 。 在 DFD 中 一 般 
不 能 明显 地 看 出 其 执行 的 次 序 。 为 了 区 分 数据 流 和 控制 流 ， 可 以 简单 地 回答 下 列 问题 :“ 这 条 
线 上 是 否 有 数据 流 过 ? ”， 如 果 有 表示 是 数据 流 ， 否 则 是 控制 流 。 

(3) 避免 一 个 加 工 有 过 多 的 数据 流 。 当 一 个 加 工 有 过 多 的 数据 流 时 ， 意 味 着 这 个 加 工 特别 
复杂 ， 这 往往 是 分 解 不 合理 的 表现 。 解 决 的 办 法 是 重新 分 解 ， 步 骤 如 下 。 

Q@ 把 需要 重新 分 解 的 某 张 图 的 所 有 子 图 连接 成 一 张 图 。 

@ 把 连接 后 的 图 重新 划分 成 几 个 部 分 ， 使 各 部 分 之 间 的 联系 最 小 。 

@ 重新 定义 父 图 ， 即 第 @ 步 中 的 每 个 部 分 作为 父 图 中 的 一 个 加 工 。 

@ 重新 建立 各 子 图 ， 即 第 @ 步 中 的 每 个 部 分 都 是 一 张 子 图 。 

图 为 所 有 的 加 工 重新 命名 并 编号 。 

(4) 分 解 尽 可 能 均匀 。 理 想 的 分 解 是 将 一 个 问题 加工) 分 解 成 大 小 均匀 的 若干 个 子 问题 
( 子 加 工 )， 也 就 是 说 ， 对 于 任何 一 张 DFD， 其 中 的 任何 两 个 加 工 的 分 解 层 数 之 差 不 超过 1。 如 
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果 在 同一 张 图 中 ， 某 些 加 工 已 是 基本 加 工 ， 而 另 一 些 加 工 仍 需 分 解 若干 层 ， 那 么 ， 这 张 图 就 是 
分 解 不 均匀 的 。 

(5) 先 考虑 确定 状态 ， 忽 略 琐碎 的 细节 。 在 构造 DFD 时 ， 应 集中 精力 先 考虑 稳定 状态 下 
的 各 种 问题 ， 暂 时 不 考虑 系统 如 何 自 动 、 如 何 结束 、 出 错 处 理 以 及 性 能 等 问题 ， 这 些 问 题 可 以 
在 分 析 阶 段 的 后 期 ， 在 需求 规约 中 加 以 说 明 。 

(6) 随时 准备 重 画 。 对 于 一 个 复杂 的 软件 系统 ， 其 分 层 DFD 很 难 一 次 开发 成 功 ， 往 往 要 
经 历 反复 多 次 的 重 画 和 修改 ， 才 能 构造 出 完整 、 合 理 、 满 足 用 户 需 求 的 分 层 DFD。 

3) 分 解 的 程度 

在 自 顶 向 下 画 数据 流 图 时 ， 为 了 便于 对 分 解 层 数 进行 把 握 ， 可 以 参照 以 下 几 条 与 分 解 有 关 
的 原则 。 

(1) 7 加 减 2。 

(2) 分 解 应 自然 ， 概 念 上 应 合理 、 清 晰 。 

(3) 只 要 不 影响 DFD 的 易 理解 性 ， 可 适当 增加 子 加 工 数量 ， 以 减少 层 数 。 

(4) 一 般 来 说 ， 上 层 分 解 得 快 一 些 〈 即 多 分 解 几 个 加 工 )， 下 层 分 解 得 慢 一 些 〈 即 少 分 解 
几 个 加 工 )。 

(5) 分 解 要 均匀 。 


6.2.3 数据 字典 (DD ) 
数据 流 图 描述 了 系统 的 分 解 ， 但 没有 对 图 中 各 成 分 进行 说 明 。 数 据 字 典 就 是 为 数据 流 图 中 


的 每 个 数据 流 、 文 件 、 加 工 ， 以 及 组 成 数据 流 或 文件 的 数据 项 做 出 说 明 。 其 中 ， 对 加 工 的 描述 
称 为 “小 说 明 ”， 也 可 以 称 为 “加 工 逻 辑 说 明 ”。 

1. 数据 字典 的 内 容 

数据 字典 有 以 下 4 类 条 目 : 数据 流 、 数 据 项 、 数 据 存储 和 基本 加 工 。 数 据 项 是 组 成 数据 流 
和 数据 存储 的 最 小 元 素 。 源 点 、 终 点 不 在 系统 之 内 ， 故 一 般 不 在 字典 中 说 明 。 

(1) 数据 流 条 目 。 数 据 流 条 目 给 出 了 DFD 中 数据 流 的 定义 ， 通 常 列 出 该 数据 流 的 各 组 成 
数据 项 。 在 定义 数据 流 或 数据 存储 组 成 时 ， 使 用 表 6-1 给 出 的 符号 。 

表 6-1 在 数据 字典 的 定义 式 中 出 现 的 符号 

举例 及 说 明 


x=qtb， 表 示 x 由 a 和 4b 组 成 
x=[alB]， 表 示 x 由 a 或 5 组 成 
x= {a}， 表 示 x 由 0 个 或 多 个 a 组 成 


~ itl 
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续 表 


举例 及 说 明 
x=2{qs 或 x= {a}; ， 表 示 x 中 最 少 出 现 2 次 a， 最 多 出 现 5 
次 a。5、2 为 重复 次 数 的 上 、 下 限 

x=(q) 表 示 a 可 在 x 中 出 现 ， 也 可 不 出 现 

x 二 “a”， 表 示 x 是 取 值 为 字符 a 的 数据 元 素 

x 二 1.9， 表 示 x 可 取 1~9 中 的 任意 一 个 值 


(2) 数据 存储 条 目 。 数 据 存储 条 目 是 对 数据 存储 的 定义 。 

(3) 数据 项 条 目 。 数 据 项 条 目 是 不 可 再 分 解 的 数据 单位 。 

(4) 基本 加 工 条 目 。 加 工 条 目 是 用 来 说 明 DFD 中 基本 加 工 的 处 理 罗 辑 的 ， 由 于 下 层 的 基 
本 加 工 是 由 上 层 的 加 工分 解 而 来 ， 只 要 有 了 基本 加 工 的 说 明 ， 就 可 理解 其 他 加 工 。 


2. 数据 词典 管理 


词典 管理 主要 是 把 词典 条 目 按照 某 种 格式 组 织 后 存储 在 词典 中 ， 并 提供 排序 、 查 找 和 统计 
等 功能 。 如 果 数 据 流 条 目 包 含 了 来 源 和 去 向 ， 文 件 条 目 包 含 了 读 文件 和 写 文件 ， 还 可 以 检查 数 
据 词 典 与 数据 流 图 的 一 致 性 。 


3. 加 工 逻 辑 的 描述 


加 工 逻 辑 也 称 为 “小 说 明 ”。 常 用 的 加 工 逻 辑 描述 方法 有 结构 化 语言 、 判 定 表 和 判定 树 
3 种 。 

1) 结构 化 语言 

结构 化 语言 (如 结构 化 英语 〉 是 一 种 介 于 自然 语言 和 形式 化 语言 之 间 的 半 形 式 化 语言 ， 是 
自然 语言 的 一 个 受 限 子 集 。 

结构 化 语言 没有 严格 的 语法 ， 它 的 结构 通常 可 分 为 内 层 和 外 层 。 外 层 有 严格 的 语法 ， 内 层 
的 语法 比较 灵活 ， 可 以 接近 于 自然 语言 的 描述 。 

(1) 外 层 。 用 来 描述 控制 结构 ， 采 用 顺序 、 选 择 和 重复 3 种 基本 结构 。 

@ 顺序 结构 。 一 组 祈 使 语句 、 选 择 语句 、 重 复 语句 的 顺序 排列 。 祈 使 语句 是 指 至 少 包含 
一 个 动词 及 一 个 名 词 ， 指 出 要 执行 的 动作 及 接受 动作 的 对 象 。 

@ 选择 结构 。 一 般 用 IF-THEN-ELSE-ENDIF、CASE-OF-ENDCASE 等 关键 词 。 

@ 重复 结构 。 一 般 用 DO-WHILE-ENDDO、REPEAT-UNTIL 等 关键 词 。 

(2) 内 层 。 一 般 采用 祈 使 语句 的 自然 语言 短语 , 使 用 数据 字典 中 的 名 词 和 有 限 的 自 定义 词 ， 
其 动词 含义 要 具体 ， 尽 量 不 用 形容 词 和 副词 来 修饰 ， 还 可 使 用 一 些 简单 的 算法 运算 和 逻辑 运算 
符号 。 


人 
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2) 判定 表 

在 有 些 情 况 下 ， 数 据 流 图 中 某 个 加 工 的 一 组 动作 依赖 于 多 个 逻辑 条 件 的 取 值 。 这 时 ， 用 自 
然 语言 或 结构 化 语言 都 不 易于 清楚 地 描述 出 来 ， 而 用 判定 表 能 够 清楚 地 表示 复杂 的 条 件 组 合 与 
应 做 的 动作 之 间 的 对 应 关系 。 

判定 表 由 4 个 部 分 组 成 ， 用 双 线 分 割 成 4 个 区 域 ， 如 图 6-12 所 示 。 


条 件 定义 条 件 取 值 的 组 合 


动作 定义 在 各 种 取 值 的 组 合 下 应 执行 的 动作 


图 6-12 判定 表 结 构 


3) 判定 树 
判定 树 是 判定 表 的 变形 ， 一 般 情 况 下 它 比 判定 表 更 直观 ， 且 易于 理解 和 使 用 。 


6.3 结构 化 设计 方法 


结构 化 设计 (Structured Design，SD) 方法 是 一 种 面向 数据 流 的 设计 方法 ， 它 可 以 与 SA 方 
法 衔接 。 结 构 化 设计 方法 的 基本 思想 是 将 系统 设计 成 由 相对 独立 、 功 能 单一 的 模块 组 成 的 结构 。 

结构 化 设计 方法 中 用 结构 图 (Structure Chart) 来 描述 软件 系统 的 体系 结构 ， 指 出 一 个 软件 
系统 由 哪些 模块 组 成 ， 以 及 模块 之 间 的 调用 关系 。 


6.3.1 结构 化 设计 的 步骤 


结构 化 设计 大 致 可 以 分 为 两 步 进行 ， 第 一 步 是 建立 一 个 满足 软件 需求 规约 的 初始 结构 图 ， 
第 二 步 是 对 结构 图 进行 改进 。 


1. 建立 初始 结构 图 


结构 化 方法 本 质 上 是 一 种 功能 分 解 方法 。 在 结构 化 设计 时 ， 可 以 将 整个 软件 看 作 一 个 大 的 
功能 模块 〈 结 构图 中 的 模块 )， 通 过 功能 分 解 将 其 分 解 成 若干 个 较 小 的 功能 模块 ， 每 个 较 小 的 
功能 模块 还 可 以 进一步 分 解 ， 直 到 得 到 一 组 不 必 再 分 解 的 模块 〈 结 构图 中 的 底层 模块 )。 当 一 
个 功能 模块 分 解 成 若干 个 子 功能 模块 时 ， 该 功能 模块 实际 上 就 是 根据 业务 流程 调用 相应 的 子 功 
能 模块 ， 并 根据 其 功能 要 求 对 子 功能 的 结果 进行 处 理 ， 最 终 实现 其 功能 要 求 。 

功能 模块 的 分 解 应 满足 自 项 向 下 、 逐 步 求 精 、 信 息 隐 蔽 、 高 内 聚 低 耦 合 等 设计 准则 ， 模 块 
的 大 小 应 适中 。 通 常 ， 一 个 模块 的 大 小 以 50 一 100 行程 序 代码 为 宜 ， 即 一 个 模块 的 程序 代码 可 
以 写 在 1~2 页 纸 上 。 
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2. 对 结构 图 的 改进 


初始 结构 图 往往 存在 一 些 不 合理 的 设计 〈 包 括 不 合理 的 模块 分 解 )， 因 此 ， 可 根据 设计 准 
则 对 其 进行 改进 。 


3. 书写 设计 文档 


在 概要 设计 完成 之 后 应 书写 设计 规格 说 明 ， 特 别 要 为 每 个 模块 书写 模块 的 功能 、 接 口 、 约 
束 和 限制 等 ， 必 要 时 可 建立 模块 开发 卷宗 。 


4. 设计 评审 
对 设计 结果 及 文档 进行 评审 。 
6.3.2 数据 流 图 到 软件 体系 结构 的 映射 


结构 化 设计 是 将 结构 化 分 析 的 结果 数据 流 图 ) 映射 成 软件 的 体系 结构 (结构 图 )。 根 据 
信息 流 的 特点 ， 可 将 数据 流 图 分 为 变换 型 数据 流 图 和 事务 型 数据 流 图 ， 其 对 应 的 映射 分 别称 为 
变换 分 析 和 事务 分 析 。 


1. 信息 流 的 类 型 


在 需求 分 析 阶 段 , 用 SA 方法 产生 了 数据 流 图 。 面 向 数据 流 的 设计 能 方便 地 将 DFD 转换 成 
程序 结构 图 。 DFD 中 从 系统 的 输入 数据 流 到 系统 的 输出 数据 流 的 一 连 串 连续 变换 形成 了 一 条 信 
息 流 。DFD 的 信息 流 大 体 上 可 以 分 为 两 种 类 型 : 变换 流 和 事务 流 。 

(1) 变换 流 。 信 息 沿 着 输入 通路 进入 系统 ， 同 时 将 信息 的 外 部 形式 转换 成 内 部 表示 ， 然 后 
通过 变换 中 心 〈 也 称 主 加 工 ) 处 理 ， 再 沿 着 输出 通路 转换 成 外 部 形式 离开 系统 。 具 有 这 种 特性 
的 信息 流 称 为 变换 流 。 变 换 流 型 的 DFD 可 以 明显 地 分 成 输入 、 变 换 〈 主 加 工 )】 和 输出 三 大 部 分 。 

(2) 事务 流 。 信 息 沿 着 输入 通路 到 达 一 个 事务 中 心 ， 事 务 中 心 根据 输入 信息 〈 即 事务 ) 的 
类 型 在 若干 个 动作 序列 〈 称 为 活动 流 ) 中 选择 一 个 来 执行 ， 这 种 信息 流 称 为 事务 流 。 事 务 流 有 
明显 的 事务 中 心 ， 各 活动 流 以 事务 中 心 为 起 点 呈 辐 射 状 流出 。 

2. 变换 分 析 


变换 分 析 是 从 变换 流 型 的 DFD 导出 程序 结构 图 。 
1) 确定 输入 流 和 输出 流 ， 分 离 出 变换 中 心 
把 DFD 中 系统 输入 端的 数据 流 称 为 物理 输入 ， 系 统 输出 端的 数据 流 称 为 物理 输出 。 物 理 
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输入 通常 要 经 过 编辑 、 格 式 转换 、 合 法 性 检查 、 预 处 理 等 辅助 性 的 加 工 才 能 为 主 加 工 的 真正 输 
入 〔 称 为 逻辑 输入 )。 从 物理 输入 端 开始 ， 一 步 步 向 系统 的 中 间 移 动 ， 可 找到 离 物 理 输入 端 最 
远 ， 但 仍 可 被 看 作 系统 输入 的 那个 数据 流 ， 这 个 数据 流 就 是 逻辑 输入 。 同 样 ， 由 主 加 工 产 生 的 
输出 ( 称 为 逻辑 输出 ) 通 常 也 要 经 过 编辑 、 格 式 转换 、 组 成 物理 块 、 缓 六 处 理 等 辅助 加 工 才能 
变 成 物理 输出 。 从 物理 输出 端 开始 ， 一 步 步 向 系统 的 中 间 移 动 ， 可 找到 离 物理 输出 端 最 远 ， 但 
仍 可 被 看 作 系统 输出 的 那个 数据 流 ， 这 个 数据 流 就 是 逻辑 输出 。 

DFD 中 从 物理 输入 到 逻辑 输入 的 部 分 构成 系统 的 输入 流 , 从 逻辑 输出 到 物理 输出 的 部 分 构 
成 系统 的 输出 流 ， 位 于 输入 流 和 输出 流 之 间 的 部 分 就 是 变换 中 心 。 

2) 第 一 级 分 解 

第 一 级 分 解 主 要 是 设计 模块 结构 的 项 层 和 第 一 层 。 一 个 变换 流 型 的 DFD 可 以 映射 成 如 图 
6-13 所 示 的 程序 结构 图 。 图 中 顶层 模块 的 功能 就 是 整个 系统 的 功能 。 输 入 控制 模块 用 来 接收 所 
有 的 输入 数据 ， 变 换 控制 模块 用 来 实现 输入 到 输出 的 变换 ， 输 出 控制 模块 用 来 产生 所 有 的 输出 
数据 。 


图 6-13 ”变换 分 析 的 第 一 级 分 解 


3) 第 二 级 分 解 

第 二 级 分 解 主要 是 设计 中 、 下 层 模块 。 

(1) 输入 控制 模块 的 分 解 。 从 变换 中 心 的 边界 开始 ， 沿 着 每 条 输入 通路 ， 把 输入 通路 上 的 
每 个 加 工 映 射 成 输入 控制 模块 的 一 个 低层 模块 。 

(2) 输出 控制 模块 的 分 解 。 从 变换 中 心 的 边界 开始 ， 沿 着 每 条 输出 通路 ， 把 输出 通路 上 的 
每 个 加 工 映 射 成 输出 控制 模块 的 一 个 低层 模块 。 

(3) 变换 控制 模块 的 分 解 。 变 换 控制 模块 通常 没有 通用 的 分 解 方法 ， 应 根据 DFD 中 变换 
部 分 的 实际 情况 进行 设计 。 

4) 事务 分 析 

事务 分 析 是 从 事务 流 型 DFD 导出 程序 结构 图 。 

(1) 确定 事务 中 心 和 每 条 活动 流 的 流 特性 。 图 6-14 给 出 了 事务 流 型 DFD 的 一 般 形式 。 其 
中 ， 事 务 中 心 〈 图 中 的 T) 位 于 数 条 活动 流 的 起 点 ， 这 些 活动 流 从 该 点 呈 辐 射 状 流出 。 每 条 活 
动 流 也 是 一 条 信息 流 ， 它 可 以 是 变换 流 ， 也 可 以 是 另 一 条 事务 流 。 一 个 事务 流 型 的 DFD 由 输 
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入 流 、 事 务 中心 和 若干 条 活动 流 组 成 。 
(2) 将 事务 流 型 DFD 映射 成 高 层 的 程序 结构 。 事 务 流 型 DFD 的 高 层 结构 如 图 6-15 所 示 。 
项 层 模块 的 功能 就 是 整个 系统 的 功能 。 接 收 模块 用 来 接收 输入 数据 ， 它 对 应 于 输入 流 。 发 送 模 
块 是 一 个 调度 模块 ， 控 制 下 层 的 所 有 活动 模块 。 每 个 活动 流 模块 对 应 于 一 条 活动 流 ， 它 也 是 该 
活动 流 映 射 成 的 程序 结构 图 中 的 顶层 模块 。 
一、 活动 流 


图 6-14 事务 流 图 6-15 事务 流 型 DFD 的 高 层 程序 结构 


(3) 进一步 分 解 。 接 收 模块 的 分 解 类 同 于 变换 分 析 中 输入 控制 模块 的 分 解 。 每 个 活动 流 模 
块根 据 其 流 特性 变换 流 或 事务 流 ) 进一步 采用 变换 分 析 或 事务 分 析 进 行 分 解 。 

5) SD 方法 的 设计 步骤 

(1) 复查 并 精 化 数据 流 图 。 

(2) 确定 DFD 的 信息 流 类 型 〈 变 换 流 或 事务 流 )。 

(3) 根据 流 类 型 分 别 实施 变换 分 析 或 事务 分 析 。 

(4) 根据 系统 设计 的 原则 (参见 5.1.2 节 ) 对 程序 结构 图 进行 优化 。 


6.4 WebApp 分 析 与 设计 


WWW 的 早期 (大 约 从 1990 年 到 1995 年 )，Web 站 点 仅 包含 链接 在 一 起 的 一 些 超 文 本 文 
件 , 这 些 文件 使 用 文本 和 有 限 的 图 形 来 表示 信息 。 随 着 时 间 的 推移 , 一 些 开发 工具 (例如 XML、 
Java) 扩展 了 HTML 的 能 力 , 使 得 Web 工程 师 在 向 客户 提供 信息 的 同时 也 能 提供 计算 能 力 。 因 
此 ， 基 于 Web 的 系统 与 应 用 (总 称 为 WebApp) 诞生 了 。 今 天 ，WebApp 已 经 发 展 成 为 成 熟 的 
计算 工具 ， 这 些 工具 不 仅 可 以 为 最 终 用 户 提供 独立 的 功能 ， 而 且 已 经 同 公司 数据 库 和 业务 应 用 
集成 在 一 起 了 。WebApp 的 特性 使 得 大 多 数 WebApp 适合 采用 敏捷 开发 过 程 模型 进行 开发 。 
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6.4.1 WebApp 的 特性 


绝 大 多 数 WebApp 具备 下 列 属性 。 

(1) 网 络 密集 性 。WebApp 驻 留 在 网 络 上 ， 服 务 于 不 同 客户 全 体 的 需求 。 网 络 提供 开放 的 
访问 和 通信 (如 Internet) 或 者 受 限 的 访问 和 通信 〈 如 企业 内 联网 )。 

(2) 并 发 性 。 大 量 用 户 可 能 同时 访问 WebApp。 很 多 情况 下 最 终 用 户 的 使 用 模式 存在 很 大 
的 差异 。 

(3) 无 法 预知 的 负载 量 。WebApp 的 用 户 数 量 每 天 都 可 能 有 数量 级 的 变化 。 例 如 ， 周 一 显 
示 有 100 个 用 户 使 用 系统 ， 周 四 就 有 可 能 会 有 10000 个 用 户 。 

(4) 性 能 。 如 果 一 位 WebApp 用 户 必须 等 待 很 长 时 间 访问 、 服 务 器 端 处 理 、 客 户 端 格 
式 化 显示 )， 该 用 户 就 可 能 转向 其 他 地 方 。 

(5) 可 用 性 。 尽 管 期 望 百分之百 的 可 用 性 是 不 切实 际 的 ， 但 是 对 于 热门 的 WebApp， 用 户 
通常 要 求 能 够 24/7/365〈 全 天 候 ) 访问 。 

(6) 数据 驱动 。 许 多 WebApp 的 主要 功能 是 使 用 超 媒 体 向 最 终 用 户 提供 文本 、 图 片 、 音 
频 及 视频 内 容 。 除 此 之 外 ，WebApp 还 常 被 用 来 访问 那些 存储 在 Web 应 用 环境 之 外 的 数据 库 中 
的 信息 。 


6.4.2 ”WebApp 需求 模型 


WebApp 分 析 与 传统 的 软件 需求 分 析 有 所 不 同 。 虽 然 传统 的 软件 需求 分 析 的 概念 和 原则 全 
部 可 以 应 用 于 Web 工程 的 分 析 活 动 , 但 WebApp 分 析 的 内 容 及 参考 的 元 素 还 是 呈现 出 了 其 特殊 
性 。 并 针对 其 特点 ， 出 现 如 面向 数据 的 基于 ER 发 展 而 来 的 WebML、 模 型 对 象 基于 UML 的 
UWE 等 建 模 方法 。 严 格 意义 上 讲 ， 这 些 方法 并 非 均 为 结构 化 方法 ， 但 是 为 了 集中 描述 WebApp 
的 建 模 ， 将 其 归 在 本 章 介绍 。 

建 模 以 需求 工程 中 确定 的 用 户 类 别 、 可 用 目标 、 使 用 场景 、 业 务 环节 等 各 类 需求 等 为 输入 ， 
产生 如 下 5 种 主要 的 模型 类 型 。 


1. 内 容 模型 


内 容 模型 给 出 由 WebApp 提供 的 全 部 系列 内 容 ， 包 括 文字 、 图 形 、 图 像 、 音 频 和 视频 。 内 
容 模型 包含 结构 元 素 ， 它 们 为 WebApp 的 内 容 需求 提供 了 一 个 重要 的 视图 。 这 些 结构 元 素 包含 
内 容 对 象 和 所 有 分 析 类 ， 在 用 户 与 WebApp 交互 时 生成 并 操作 用 户 可 见 的 实体 。 

内 容 的 开发 可 能 发 生 在 WebApp 实现 之 前 、WebApp 构建 之 中 ， 或 者 WebApp 投入 运行 以 
后 的 很 长 一 段 时 间 里 。 在 每 种 情况 下 ， 它 都 通过 导航 链接 合并 到 WebApp 的 总 体 结构 中 。 内 容 
对 象 可 能 是 产品 的 文本 描述 、 描 述 新 闻 事 件 的 一 篇 文章 、 拍 摄 的 一 张 动作 照片 、 在 一 次 论坛 讨 
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论 中 某 个 用 户 的 回答 、 一 个 演讲 的 简短 视频 等 。 这 些 内 容 对 象 可 能 存储 分 布 于 分 离 的 文件 中 ， 
直接 嵌入 Web 页 中 ， 或 从 数据 库 中 动态 获得 。 换 名 话说， 内 容 对 象 是 呈现 给 最 终 用 户 具 有 汇聚 
信息 的 所 有 条 目 。 

通过 检查 直接 或 间接 引用 内 容 的 场景 描述 ， 可 以 根据 用 例 直 接 确 定 出 内 容 对 象 。 内 容 模型 
必须 具备 描述 内 容 对 象 构件 的 能 力 。 在 许多 实例 中 ， 用 一 个 简单 的 内 容 对 象 列 表 ， 并 给 出 每 个 
对 象 的 简短 描述 就 足以 定义 和 实现 所 必需 的 内 容 需 求 。 但 是 在 某 些 情 况 下 ， 内 容 模型 可 以 从 更 
丰富 的 分 析 中 获得 好 处 ， 即 在 内 容 对 象 之 间 的 关系 和 WebApp 维护 的 内 容 层 次 中 采用 图 形 表示 
其 关系 。 

图 6-16 中 的 数据 树 表述 了 常用 于 描述 某 个 构件 的 一 种 信息 层次 , 不 带 阴 影 的 长 方形 表示 简 
单 或 复合 数据 项 〈 一 个 或 多 个 数据 值 )， 带 阴影 的 长 方形 表示 内 容 对 象 。 在 此 图 中 ,“ 描 述说 明 ” 
是 由 5 个 内 容 对 象 定义 的 。 在 某 些 情况 下 ， 随 着 数据 数 的 扩展 ， 其 中 的 一 个 或 多 个 对 象 将 会 得 
到 进一步 细 化 。 


图 6-16 构件 的 数据 树 示例 


多 项 内 容 对 象 和 数据 项 组 成 的 任何 内 容 都 可 以 生成 数据 树 。 开 发 数据 树 尽力 在 内 容 对 象 
中 定义 层级 关系 ， 并 提供 一 种 审核 内 容 的 方法 ， 以 便 在 开始 设计 前 发 现 遗 漏 和 不 一 致 的 内 容 。 
另外 ， 数 据 树 可 以 作为 内 容 设 计 的 基础 。 


2. 交互 模型 


交互 模型 描述 了 用 户 与 WebApp 采用 了 哪 种 交互 方式 。 绝 大 多 数 WebApp 都 能 使 最 终 用 户 
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与 应 用 系统 的 功能 、 内 容 及 行为 之 间 进 行 “ 会 话 ?。 交 互 模型 由 一 种 或 多 种 元 素 构成 ， 包 括 用 
例 、 顺 序 图 、 状 态 图 、 用 户 界 面 原型 等 。 

(1) 用 例 是 交互 分 析 的 主要 工具 ， 方 便 客户 理解 系统 的 功能 。 在 许多 实例 中 ， 一 套用 例 足 
以 描述 在 分 析 阶 段 的 所 有 交互 活动 。 然 而 ， 当 遇 到 复杂 的 交互 顺序 并 包含 多 个 分 析 类 或 多 任务 
时 ， 有 时 更 值得 采用 严格 图 解 方式 描述 它们 。 

(2) 顺序 图 是 交互 分 析 中 描述 用 户 与 系统 进行 交互 的 方式 。 通 过 顺序 图 ， 能 显示 用 户 按照 
一 定 的 顺序 使 用 系统 ， 以 完成 相应 的 功能 。 

(3) 状态 图 是 交互 分 析 中 对 系统 进行 动态 的 描述 。 

(4) 用 户 界面 原型 展现 用 户 界面 布局 内容、 主要 导航 链接 、 实 施 的 交互 机 制 及 用 户 WebApp 
的 整体 美观 度 。 尽 管用 户 界面 原型 的 设计 可 以 说 是 一 个 设计 活动 ， 但 最 好 在 创建 分 析 模 型 时 就 
实施 它 。 对 用 户 界面 的 物理 表示 评估 得 越 早 ， 越 有 可 能 满足 最 终 用 户 的 需求 。 


3. 功能 模型 


许多 WebApp 提供 大 量 的 计算 和 操作 功能 ， 这 些 功 能 与 内 容 直 接 相 关 〔 既 能 使 用 又 能 生成 
内 容 )。 这 些 功能 常常 以 用 户 一 一 WebApp 的 交互 活动 为 主要 目标 ， 正 是 由 于 这 个 原因 必须 对 功 
能 需求 进行 分 析 ， 并 且 当 需要 时 也 可 以 用 于 建 模 过 程 。 

功能 模型 定义 了 将 用 于 WebApp 内 容 并 描述 其 他 处 理 功能 的 操作 ， 这 些 处 理 功能 不 依赖 于 
内 容 却 是 最 终 用 户 所 必需 的 。 功 能 模型 描述 WebApp 的 两 个 处 理 元 素 ， 每 个 处 理 元 素 代表 抽象 
过 程 的 不 同 层次 : 用户 可 观察 到 的 功能 是 由 WebApp 传递 给 最 终 用 户 的 ，@ 分 析 类 中 的 操作 
实现 与 类 相关 的 行为 。 

用 户 可 观察 到 的 功能 包括 直接 由 用 户 启动 的 任何 处 理 功 能 。 这 些 功能 实际 上 可 能 使 用 分 析 
类 中 的 操作 完成 ， 但 是 从 最 终 用 户 的 角度 看 ， 这 些 功能 是 可 见 的 结果 。 

在 抽象 过 程 的 更 低层 次 ， 分 析 模 型 描述 了 由 分 析 类 操作 执行 的 处 理 。 这 些 操作 可 以 操纵 类 
的 属性 ， 并 参与 类 之 间 的 协作 来 完成 所 需要 的 行为 。 不 管 抽象 过 程 的 层次 如 何 ，UML 的 活动 
图 可 以 用 来 表示 处 理 细节 。 在 分 析 阶 段 ， 仅 在 功能 相对 复杂 的 地 方才 会 使 用 活动 图 。 许 多 
WebApp 的 复杂 性 不 是 出 现在 提供 的 功能 中 ， 而 是 与 可 访问 信息 的 性 质 以 及 操作 的 方式 相关 。 


4. 导航 模型 


导航 模型 为 WebApp 定义 所 有 导航 策略 。 导 航模 型 考虑 了 每 一 类 用 户 如 何 从 一 个 WebApp 
元 素 〈 例 如 内 容 对 象 ) 导航 到 另 一 个 元 素 。 把 导航 机 制定 义 为 设计 的 一 部 分 ， 在 这 个 阶段 ， 分 
析 人 员 应 该 关注 于 总 体 的 导航 需求 ， 应 考虑 以 下 问题 。 

。 ” 某 些 元 素 比 其 他 元 素 更 容易 达到 吗 ( 即 需 要 更 少 的 导航 步骤 )? 表示 的 优先 级 是 什么 ? 

。 为 了 促使 用 户 以 他 们 自己 的 方向 导航 ， 应 该 强调 某 些 元 素 吗 ? 
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。 应 该 怎样 处 理 导航 错误 ? 

。 ”导航 到 关键 元 素 组 的 优先 级 应 该 高 于 导航 到 某 个 特定 元 素 的 优先 级 吗 ? 

。 ”应 该 通过 链接 方式 、 基 于 搜索 的 访问 方式 还 是 其 他 方式 来 实现 导航 ? 

。 根据 前 面 的 导航 行为 ， 某 些 确定 的 元 素 应 该 展现 给 用 户 吗 ? 

。 ”应 该 为 用 户 维护 导航 日 志 吗 ? 

。 在 用 户 交互 的 每 一 点 处 ， 一 个 完整 的 导航 地 图 或 菜单 都 可 用 吗 ? 

。 ”导航 设计 应 该 由 大 多 数 普遍 期 望 的 用 户 行为 来 驱动 ， 还 是 由 已 定义 的 WebApp 元 素 可 
感知 的 重要 性 来 驱动 ? 

。 为 了 促进 将 来 使 用 快捷 方式 ， 一 个 用 户 能 否 “存储 ”他 以 前 对 WebApp 的 导航 ? 

。 ”应 该 为 哪 类 用 户 设 计 最 佳 导航 ? 

。 应 该 如 何 处 理 WebApp 外 部 的 链接 ? 应 该 覆盖 现 有 的 浏览 器 窗口 吗 ? 能 否 作 为 一 个 新 
的 浏览 器 窗口 ， 还 是 作为 一 个 单独 的 框架 ? 

提出 并 回答 这 些 问题 及 其 他 一 些 问题 是 导航 分 析 的 一 部 分 工作 。 


S. 配置 模型 


配置 模型 描述 WebApp 所 在 的 环境 和 基础 设施 。 

在 某 些 情况 下 ， 配 置 模型 只 不 过 是 服务 器 端 和 客户 端的 属性 列表 。 但 是 对 于 更 复杂 的 
WebApp 来 说 ， 多 种 配置 的 复杂 性 〈 例 如 ， 多 服务 器 之 间 的 负载 分 配 、 高 速 缓存 的 体系 结构 、 
远程 数据 库 、 同 一 网 页 上 服务 于 不 同 对 象 的 多 个 服务 器 ) 可 能 对 分 析 和 设计 产生 影响 。 在 必须 
考虑 复杂 配置 体系 结构 的 情况 下 ， 可 以 使 用 UML 部 署 图 。 

6.4.3 WebApp 设计 


好 的 WebApp 应 该 具有 的 最 相关 的 通用 特性 是 可 用 性 、 功 能 性 、 可 靠 性 、 效率、 可 维护 性 、 
安全 性 、 可 扩展 性 、 以 及 及 时 性 。WebApp 的 设计 目标 是 简单 性 、 一 致 性 、 符 合 性 、 健 壮 性 、 
导航 性 、 视 觉 吸 引力 与 兼容 性 。WebApp 设计 根据 其 类 型 不 同 ， 适 合 采用 混合 的 各 种 技术 ， 进 
行 一 系列 设计 动作 ， 包 括 : 架构 设计 、 构 件 设计 、 内 容 设 计 、 导 航 设 计 、 美 学 设计 、 界 面 设计 。 
很 多 情况 下 ， 多 类 设计 并 行进 行 。 

1. 架构 设计 


WebApp 描述 了 使 WebApp 达到 其 业务 目标 的 基础 结构 ， 典 型 使 用 多 层 架 构 来 构造 ， 包 括 
用 户 界面 或 展示 层 、 基 于 一 组 业务 规则 来 指导 与 客户 端 浏 览 器 进行 信息 交互 的 控制 器 ， 以 及 可 
以 包含 WebApp 的 业务 规则 的 内 容 层 或 模型 层 ， 描 述 将 以 什么 方式 来 管理 用 户 交互 、 操 作 内 部 
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处 理 任务 、 实 现 导航 及 展示 内 容 。 模 型 -视图 -控制 器 (Model-View-Controller，MVC) 结构 是 
WebApp 基础 结构 模型 之 一 ， 它 将 WebApp 功能 及 信息 内 容 分 离 。 


2. 构件 设计 


在 WebApp 中 ， 内 容 和 功能 的 界限 通常 并 不 清晰 ， 因 此 首先 明确 WebApp 构件 : @ 定 义 良 
好 的 聚合 功能 ， 为 最 终 用 户 处 理 内 容 或 提供 计算 或 处 理 数据 ;@ 内 容 和 功能 的 聚合 包 ， 提 供 最 
终 用 户 所 需要 的 功能 。 因 此 ，WebApp 构件 设计 通常 包括 内 容 设计 元 素 和 功能 设计 元 素 。 

(1) 构件 级 内 容 设 计 。 关 注 内 容 对 象 ， 以 及 包装 后 展示 给 最 终 用 户 的 方式 ， 应 该 适合 创建 
的 WebApp 特性 。 一 般 情况 下 ， 内 容 对 象 不 需要 被 组 织 成 构件 ， 加 以 分 别 实 现 。 但 是 ， 随 着 
WebApp、 内 容 对 象 及 其 关系 的 规模 和 复杂 度 的 增长 ， 组 织 内 容 是 必要 的 。 

(2) 构件 级 功能 设计 。 将 WebApp 作为 一 系列 构件 加 以 交付 ， 这 些 构件 与 信息 体系 结构 并 
行 开 发 ， 以 确保 一 致 性 。 并 且 需 要 在 一 开始 就 考虑 需求 模型 和 初始 信息 架构 ， 然 后 再 进一步 考 
查 功 能 如 何 影响 用 户 与 系统 的 交互 、 要 展示 的 信息 以 及 要 管理 的 用 户 任务 。 在 架构 设计 中 ， 往 
往 将 WebApp 的 内 容 和 功能 结合 在 一 起 来 设计 功能 架构 ， 描 述 关 键 的 功能 构件 及 其 交互 。 


3. 内 容 设 计 


WebApp 的 内 容 结构 〈 线 性 或 非 线 性 ) 也 影响 架构 ， 因 此 设计 内 容 体系 结构 。 内 容 体系 结 
构 着 重 于 内 容 对 象 〈 诸 如 网 页 的 组 成 对 象 ) 的 表现 和 导航 的 组 织 ， 通 常 采用 线性 结构 、 网 格 结 
构 、 层 次 结构 、 网 络 结构 四 种 结构 及 其 组 合 。 当 内 部 交互 可 预测 顺序 很 常见 时 ， 采 用 线性 结构 ， 
如 帮助 文档 、 产 品 订单 输入 顺序 等 。 当 WebApp 内 容 按 类 别 组 织 成 十 分 规则 的 二 维 或 多 维 时 
可 以 采用 网 格 结构 ， 如 销售 网 站 水 平 代表 要 出 售 的 商品 准 类 ， 科 直 表 示 制 造 商 。 层 次 结构 可 以 
设计 成 是 控制 流水 平地 穿 过 简直 分 支 〈 通 过 超 文 本 ) 的 方式 , 即 同 层 之 间 可 以 通过 超 链接 相连 。 
网 络 结构 一 般 是 对 网 页 进行 设计 ， 使 其 能 够 将 控制 通过 超 链接 传递 到 系统 中 几乎 所 有 的 网 页 。 
将 上 述 设计 结构 进行 组 合 ， 就 形成 复合 结构 。 


4. 导航 设计 


建立 了 WebApp 的 体系 结构 及 其 构件 后 ， 定 义 导 航路 径 ， 使 用 户 可 以 访问 WebApp 的 内 容 
和 功能 。 为 每 一 类 用 户 角色 定义 一 组 类 ， 包 含 一 个 或 多 个 内 容 对 象 或 者 包含 WebApp 的 功能 。 
当 用 户 与 WebApp 进行 交互 时 ， 会 接触 到 一 系列 导航 语义 单元 ， 即 信息 (导航 节点 ) 和 相关 的 
导航 结构 (导航 链接 ) 的 集合 ， 它 们 相互 协作 共同 完成 相关 的 用 户 请 求 的 一 部 分 。 定 义 导 航 机 
制 ， 如 导航 链接 ， 水 平 或 垂直 导航 条 列表 )， 标 签 或 者 一 个 完整 的 站 点 地 图 入 口 。 

用 户 界面 是 围绕 着 运行 在 客户 端 上 的 浏览 器 的 特性 进行 设计 的 ， 数 据 层 位 于 服务 器 上 。 
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6.5 用 户 界 面 设计 


用 户 界面 (UL 设计 在 人 与 计算 机 之 间 搭 建 了 一 个 有 效 的 交流 媒介 。 遵 循 一 系列 的 界面 设 
计 原 则 定义 界面 对 象 和 界面 设计 动作 ， 然 后 创建 构成 用 户 界 面 原型 基础 的 屏幕 布局 。 


6.5.1 用 户 界面 设计 的 黄金 原则 


Theo Mandel 在 其 关于 界面 设计 的 著作 中 提出 了 3 条 “黄金 原则 ” 用 户 操纵 控制 ;减少 用 
户 的 记忆 负担 ， 保 持 界 面 一 致 。 

这 些 黄金 原则 实际 上 构成 了 一 系列 用 户 界面 设计 原则 的 基础 ， 这 些 原则 可 以 指导 软件 设计 
的 重要 方面 。 


1. 用 户 操纵 控制 


在 很 多 情况 下 ， 设 计 者 为 了 简化 界面 的 实现 可 能 会 引入 约束 和 限制 ， 其 结果 可 能 是 界面 易 
于 构建 ， 但 会 妨碍 使 用 。Mandel 定义 了 一 组 设计 原则 ， 人 允许 用 户 操纵 控制 。 

1) 以 不 强迫 用 户 进入 不 必要 的 或 不 希望 的 动作 的 方式 来 定义 交互 模式 

交互 模式 就 是 界面 的 当前 状态 。 例 如 ， 如 果 在 字 处 理 软件 的 菜单 中 选择 拼写 检查 ， 则 软件 
将 转移 到 拼写 检查 模式 。 如 果 用 户 希 望 在 这 种 情形 下 进行 一 些 文本 编辑 ， 则 没有 理由 强迫 用 户 
停留 在 拼写 检查 模式 ， 用 户 应 该 能 够 几乎 不 需要 做 任何 动作 就 能 进入 和 退出 该 模式 。 

2) 提供 灵活 的 交互 

由 于 不 同 的 用 户 有 不 同 的 交互 偏好 ， 因 此 应 该 提供 选择 机 会 。 例 如 ， 软 件 可 能 允许 用 户 通 
过 键盘 命令 、 鼠 标 移动 、 数 字 笔 、 多 触摸 屏 或 语音 识别 命令 等 方式 进行 交互 。 但 是 ， 每 个 动作 
并 非 要 受 控 于 每 一 种 交互 机 制 。 例 如 ， 考 虑 使 用 键盘 命令 〈 或 语音 输入 ) 来 画 一 幅 复杂 形状 的 
图 形 是 有 一 定 难度 的 。 

3) 允许 中 断 和 撤销 用 户 交互 

即使 当 陷入 到 一 系列 动作 之 中 时 ， 用 户 也 应 该 能 够 中 断 动作 序列 去 做 某 些 其 他 事情 而 不 
会 失去 已 经 做 过 的 工作 )， 用 户 也 应 该 能 够 “撤销 ”任何 动作 。 

4) 当 技 能 级 别 增长 时 可 以 使 交互 流 线 化 并 允许 定制 交互 

用 户 经 常 发 现 他 们 重复 地 完成 相同 的 交互 序列 。 因 此 ， 值 得 设计 一 种 “ 宏 ” 机 制 ， 使 得 高 
级 用 户 能 够 定制 界面 以 方便 交互 。 

5) 使 用 户 与 内 部 技术 细节 隔离 开 来 

用 户 界面 应 该 能 够 将 用 户 移入 到 应 用 的 虚拟 世界 中 来 。 用 户 不 应 该 知道 操作 系统 、 文 件 管 
理 功能 或 其 他 神秘 的 计算 技术 。 其实, 界面 不 应 该 要 求 用 户 在 机 器 内 部 层次 上 进行 交互 (例如 ， 
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不 应 该 要 求 用 户 在 应 用 软件 中 输入 操作 系统 命令 )。 

6) 设计 应 允许 用 户 与 出 现在 屏幕 上 的 对 象 直接 交互 

当 用 户 能 够 操纵 完成 某 任务 所 必需 的 对 象 ， 并 且 以 一 种 该 对 象 好 像 是 真实 物理 存在 的 方式 
来 操作 它 时 ， 用 户 就 会 有 一 种 控制 感 。 例 如 ， 某 应 用 界面 可 允许 用 户 “ 拉 伸 ” 某 对 象 〈 增 大 其 
尺寸 )， 就 是 直接 操纵 的 一 种 实现 。 

2. 减轻 用 户 的 记忆 负担 


用 户 必须 记 住 的 东西 越 多 ， 与 系统 交互 时 ， 出 错 的 可 能 性 也 就 越 大 。 因 此 ， 一 个 经 过 精心 
设计 的 用 户 界 面 不 会 加 重用 户 的 记忆 负担 。 只 要 有 可 能 ， 系 统 应 该 “ 记 住 ”有 关 的 信息 ， 并 通 
过 能 够 帮助 回忆 的 交互 场景 来 帮助 用 户 。Mandel 定义 了 一 组 设计 原则 ,使 得 界面 能 够 减少 用 户 
的 记忆 负担 。 

1) 减少 对 短期 记忆 的 要 求 

当 用 户 陷于 复杂 的 任务 时 ， 短 期 记忆 的 要 求 将 会 很 大 。 界 面 的 设计 应 该 尽量 不 要 求 记 住 过 
去 的 动作 、 输 入 和 结果 。 可 行 的 解决 办 法 是 通过 提供 可 视 的 提示 ， 使 得 用 户 能 够 识别 过 去 的 动 
作 ， 而 不 是 必须 记 住 它们 。 

2) 建立 有 意义 的 默认 

初始 的 默认 集合 应 该 对 一 般 的 用 户 有 意义 ， 但 是 ， 用 户 应 该 能 够 说 明 个 人 的 偏好 。 然 而 ， 
“reset ( 重 置 )” 选 择 应 该 是 可 用 的 ， 使 得 可 以 重新 定义 初始 默认 值 。 

3) 定义 直观 的 快捷 方法 

当 使 用 助 记 符 来 完成 系统 功能 时 ， 助 记 符 应 该 以 容易 记忆 的 方式 联系 到 相关 动作 。 

4) 界面 的 视觉 布局 应 该 基于 真实 世界 的 象征 

例如 ， 一 个 账单 支付 系统 应 该 使 用 支票 每 和 支票 登记 短 来 指导 用 户 的 账单 支付 过 程 。 这 使 
得 用 户 能 够 依赖 于 很 好 理解 的 可 视 提 示 ， 而 不 是 记 住 复 杂 难 懂 的 交互 序列 。 

5) 以 不 断 进展 的 方式 揭示 信息 

界面 应 该 以 层次 化 的 方式 进行 组 织 ， 即 关于 某 任务 、 对 象 或 某 行 为 的 信息 应 该 首先 在 高 抽 
象 层次 上 呈现 。 更 多 的 细节 应 该 在 用 户 用 鼠标 点 击 表 明 兴 趣 后 再 展示 。 例 如 ， 很 多 字 处 理应 用 
中 十 分 常见 的 一 个 功能 是 加 下 画 线 ， 该 功能 本 身 是 “文本 风格 ”菜单 下 多 个 功能 中 的 一 个 。 然 
而 ， 每 种 加 下 画 线 的 功能 并 未 列 出 ， 用 户 必须 选择 加 下 画 线 ， 然 后 所 有 加 下 画 线 的 选项 〈 如 加 
单 下 画 线 、 加 双 下 画 线 、 加 虚 下 画 线 ) 才 被 展示 出 来 。 


3. 保持 界面 一 臻 


用 户 应 该 以 一 致 的 方式 展示 和 获取 信息 ， 这 意味 着 : 按照 贯穿 所 有 屏幕 显示 的 设计 规则 来 
组 织 可 视 信息 ; 将 输入 机 制约 束 到 有 限 的 集合 ， 在 整个 应 用 系统 中 得 到 一 致 的 使 用 ， 从 任务 到 
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任务 的 导航 机 制 要 一 致 地 定义 和 实现 。Mandel 定义 了 一 组 帮助 保持 界面 一 致 性 的 设计 原则 。 

1) 允许 用 户 将 当前 任务 放 入 有 意义 的 环境 中 

很 多 界面 使 用 数 十 个 屏幕 图 像 来 实现 复杂 的 交互 层次 ， 提 供 指示 器 例如， 窗口 标题 、 图 
标 、 一 致 的 颜色 编码 ) 帮助 用 户 知道 当前 工作 环境 是 十 分 重要 的 。 另 外 ， 用 户 应 该 能 够 确定 它 
来 自 何 处 以 及 存在 什么 途径 转换 到 新 任务 。 

2) 在 应 用 系统 家 族 内 保持 一 致 性 

一 组 应 用 系统 〈 或 一 套 产 品 ) 应 使 用 相同 的 设计 规则 ， 以 保持 所 有 交互 的 一 致 性 。 

3) 如 果 过 去 的 交互 模型 已 经 建立 起 了 用 户 期 望 ， 除 非 有 不 得 已 的 理由 ， 和 否则 不 要 改变 它 

一 个 特殊 的 交互 序列 一 旦 已 经 变 成 事实 上 的 标准 ， 则 用 户 在 遇 到 的 每 个 应 用 系统 中 均 会 如 
此 期 望 ， 如 果 改 变 ， 将 导致 混乱 。 


6.5.2 用户 界 面 的 分 析 与 设计 


用 户 界面 的 分 析 与 设计 过 程 始 于 创建 不 同 的 系统 功能 模型 (从 外 部 看 对 系统 的 感觉 ), 用 于 
完成 系统 功能 的 任务 被 分 为 面向 人 的 和 面向 计算 机 的 ， 考 虑 那些 应 用 到 界面 设计 中 的 各 种 设计 
问题 ， 各 种 工具 被 用 于 建造 原型 并 最 终 实现 设计 模型 ， 最 后 由 最 终 用户 从 质量 的 角度 对 结果 进 
行 评 估 。 

1. 用 户 界 面 分 析 和 设计 模型 


(1) 软件 工程 师 所 创建 的 设计 模型 (Design Model)。 整 个 系统 设计 模型 包括 对 软件 的 数据 
结构 、 体 系 结构 、 界 面 和 过 程 的 表示 。 界 面 设计 往往 是 设计 模型 的 附带 结果 。 

(2) 人 机 界面 设计 工程 师 创建 的 用 户 模型 (User Model)。 用 户 模型 描述 系统 最 终 用 户 的 特 
点 。 在 设计 前 ， 应 首先 对 用 户 进行 分 类 ， 了解 用 户 的 特点 ， 包 括 年 龄 、 性 别 、 实 际 能 力 、 教 育 、 
文化 和 种 族 背 景 、 动 机 、 目 的 以 及 个 性 等 。 

(3) 最 终 用 户 在 脑海 里 对 界面 产生 的 映像 ， 称 为 用 户 的 心理 模型 或 系统 感觉 〈System 
Perception)。 系 统 感觉 是 最 终 用 户主 观 想象 的 系统 映像 ， 描 述 了 期 望 的 系统 能 提供 的 操作 ， 其 
描述 的 精确 程度 依赖 于 最 终 用 户 对 软件 的 熟悉 程度 。 

(4) 系统 实现 者 创建 的 系统 映像 (System Image)。 系 统 映像 包括 基于 计算 机 的 系统 的 外 在 
表示 (界面 的 观感 ) 和 用 来 描述 系统 语法 和 意义 的 支撑 信息 ( 书 、 手册、 录像带、 帮助 文件 等 )。 
如 果 系 统 映像 和 系统 感觉 是 一 致 的 ， 用 户 就 会 感觉 软件 很 舒服 ， 使 用 起 来 很 有 效 。 

为 了 融合 这 些 模型 ， 设 计 模型 必须 适应 包含 在 用 户 模型 中 的 信息 ， 并 且 系 统 映像 必须 准确 
地 反映 接口 的 语法 和 语义 。 
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2. 用 户 界面 分 析 和 设计 的 过 程 


用 户 界面 的 分 析 与 设计 过 程 是 迭代 的 ， 包 括 4 个 不 同 的 框架 活动 : 界面 分 析 及 建 模 、 界 面 
设计 、 界 面 构造 和 界面 确认 。 

界面 分 析 活动 的 重点 在 于 那些 与 系统 交互 的 用 户 的 轮廓 ， 记 录 技 能 级 别 、 业 务 理解 以 及 对 
新 系统 的 一 般 感悟 ， 并 定义 不 同 的 用 户 类 型 ， 对 每 个 用 户 类 别 进 行 需求 引导 。 

界面 设计 的 目标 是 定义 一 组 界面 对 象 和 动作 (以 及 它们 的 屏幕 表示 ), 使 得 用 户 能 够 以 满足 
系统 所 定义 的 每 个 使 用 目标 的 方式 完成 所 有 定义 的 任务 。 

界面 构造 通常 开始 于 创建 可 评估 使 用 场景 的 原型 。 随 着 迭代 设计 过 程 的 继续 ， 用 户 界面 开 
发 工具 可 以 用 来 完成 界面 的 构造 。 

界面 确认 着 重 于 以 下 几 点 : 界面 正确 地 实现 每 个 用 户 任务 的 能 力 、 适 应 所 有 任务 变化 的 能 
力 以 及 达到 所 有 一 般 用 户 需 求 的 能 力 ; 界面 容易 使 用 和 学 习 的 程度 ; 用 户 将 界面 作为 其 工作 中 
有 用 工具 的 接受 程度 。 


6.5.3 ”用户 界 面 设计 问题 


在 进行 用 户 界面 设计 时 ， 几 乎 总 会 遇 到 以 下 4 个 问题 : 系统 响应 时 间 、 帮 助 设 施 、 错 误 信 
息 处 理 、 菜 单 和 命令 标记 。 


1. 系统 响应 时 间 


系统 响应 时 间 不 能 令 人 满意 是 交互 式 系统 用 户 经 常 抱怨 的 问题 。 一 般 来 说 ， 系 统 响应 时 间 
是 指 从 用 户 开 始 执行 动作 到 软件 以 预期 的 输出 和 动作 形式 给 出 响应 这 段 时 间 。 

系统 响应 时 间 包 括 两 方面 的 属性 : 时 间 长 度 和 可 变性 。 如 果 系 统 响应 时 间 过 长 ， 用 户 就 会 
感到 焦虑 和 泪 形 。 系 统 时 间 的 可 变性 是 指 相 对 于 平均 时 间 的 偏差 ， 在 很 多 情况 下 这 是 最 重要 的 
响应 时 间 特 性 。 即使 响应 时 间 比 较 长 , 响应 时 间 的 低 可 变性 也 有 助 于 用 户 建立 稳定 的 交互 节奏 。 
例如 ， 稳 定 在 1s 的 命令 响应 时 间 ， 比 从 0.1s 到 2.5s 不 定 的 响应 时 间 要 好 。 


2. 帮助 设施 


几乎 所 有 计算 机 交互 式 系统 的 用 户 都 时 常 需要 帮助 ， 考 虑 帮助 设施 时 需要 在 设计 中 解决 以 
下 问题 。 

(1) 进行 系统 交互 时 ， 是 否 在 任何 时 候 对 任何 系统 功能 都 能 得 到 帮助 ? 有 两 种 选择 : 提供 
部 分 功能 与 动作 的 帮助 和 提供 全 部 功能 的 帮助 。 

(2) 用 户 怎样 请 求 帮助 ? 有 3 种 选择 : 帮助 菜单 、 特 殊 功 能 键 和 HELP 命令 。 

(3) 如 何 表达 帮助 ? 有 3 种 选择 : 提供 单独 的 帮助 窗口 、 在 另 一 个 窗口 中 指示 参考 某 个 已 
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印刷 的 文档 (不 是 理想 方式 ) 或 在 屏幕 特定 位 置 给 出 一 行 或 两 行 的 简单 提示 。 

(4) 用 户 如 何 回 到 正常 的 交互 方式 ? 可 做 的 选择 包括 屏幕 上 显示 的 返回 按钮 、 功 能 键 或 控 
制 序列 。 

(5) 如 何 构造 帮助 信息 ? 有 3 种 选择 : 平面 结构 (所 有 信息 均 通 过 关键 词 来 访问 )、 分 层 结 
构 〈 用 户 可 以 进入 分 层 结构 得 到 更 详细 的 信息 ) 和 超 文 本 的 使 用 。 


3. 错误 信息 处 理 


出 错 信息 和 敬告 是 指出 现 问题 时 系统 反馈 给 用 户 的 “ 坏 消息 "如果 做 不 好 ， 出 错 信息 和 和 敬 
告 会 给 出 无 用 和 误导 的 信息 ， 反 而 增加 了 用 户 的 泪 表 感 。 通 常 ， 交 互 式 系统 给 出 的 出 错 信息 和 
敬告 应 具备 以 下 特征 。 

(1) 消息 以 用 户 可 以 理解 的 语言 描述 问题 。 

(2) 消息 应 提供 如 何 从 错误 中 回复 的 建设 性 意见 。 

(3) 消息 应 指出 错误 可 能 导致 哪些 不 良 后 果 (例如 破坏 数据 文件 )， 以 便 用 户 检查 是 否 出 现 
了 这 些 情况 。 

(4) 消息 伴随 着 视觉 或 听觉 上 的 提示 。 也 就 是 说 ， 显 示 消息 应 该 伴随 警告 声 或 者 消息 用 闪 
烁 方式 显示 ， 或 以 明显 表示 错误 的 颜色 来 显示 。 

(5) 消息 不 应 是 裁判 性 的 ， 即 不 能 指责 用 户 。 

4. 菜单 和 命令 标记 

输入 命令 曾经 是 用 户 和 系统 交互 的 主要 方式 ， 并 广泛 用 于 各 种 应 用 程序 中 。 现 在 ， 面 向 窗 
的 界面 采用 点 击 和 选取 方式 ， 减 少 了 用 户 对 输入 命令 的 依赖 。 但 许多 高 级 用 户 仍然 喜欢 面向 
命令 的 交互 方式 。 在 提供 命令 或 菜单 标签 交互 方式 时 ， 必 须 考虑 以 下 问题 。 

(1) 每 个 菜单 选择 是 否 都 有 对 应 的 命令 ? 

(2) 以 何 种 方式 提供 命令 ? 有 3 种 选择 :控制 序列 (如 AlttP)、 功 能 键 或 答 入 命令 。 

(3) 学 习 和 记忆 命令 的 难度 有 多 大 ? 忘记 命令 怎么 办 ? 

(4) 用 户 是 否 可 以 定制 和 缩写 命令 ? 

(5) 在 界面 环境 中 菜单 标签 是 不 是 自 解释 的 ? 

(6) 子 菜单 是 否 与 主 菜单 所 指 的 功能 相 一 致 ? 
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客观 世界 由 许多 具体 的 事物 、 事 件 、 概 念 和 规则 组 成 ， 这 些 均 可 被 看 成 对 象 。 面 向 对 象 
(Object-Oriented，OO ) 方法 是 一 种 非常 实用 的 系统 化 软件 开发 方法 ， 它 以 客观 世界 中 的 对 象 为 
中 心 , 其 分 析 和 设计 思想 符合 人 们 的 思维 方式 , 分 析 和 设计 的 结果 与 客观 世界 的 实际 比较 接近 ， 
容易 被 人 们 所 接受 。 面 向 对 象 方法 有 Booch 方法 、Coad 方法 和 OMT 方法 等 。 为 了 统一 各 种 面 
向 对 象 方法 的 术语 、 概 念 和 模型 ，1997 年 推出 了 统一 建 模 语言 (Unified Modeling Language 
UML)。 它 是 面向 对 象 的 标准 建 模 语言 ， 通 过 统一 的 语义 和 符号 表示 ， 使 各 种 方法 的 建 模 过 程 
和 表示 统一 起 来 ， 现 已 成 为 面向 对 象 建 模 的 工业 标准 。 

面向 对 象 方法 包括 面向 对 象 分 析 、 面 向 对 象 设计 和 面向 对 象 实现 ， 其 界线 并 不 明显 ， 它 们 
采用 相同 的 符号 表示 ， 能 方便 地 从 分 析 阶 段 平滑 地 过 渡 到 设计 阶段 。 此 外 ， 在 现实 生活 中 ， 用 
户 的 需求 经 常会 发 生变 化 ， 但 客观 世界 的 对 象 以 及 对 象 间 的 关系 相对 比较 稳定 ， 因 此 用 面向 对 
象 方法 分 析 和 设计 的 结果 也 相对 比较 稳定 。 本 章 主要 介绍 面向 对 象 技术 的 基本 概念 、 原 理 及 方 
法 、UML 以 及 设计 模式 。 


7.1 面向 对 象 基础 


众所周知 , 采用 系统 化 的 开发 方法 开发 软件 (特别 是 大 规模 软件 ) 系统 才 可 获得 好 的 系统 。 
什么 是 “好 ”系统 呢 ? 这 个 问题 应 从 使 用 者 〈 外 部 ) 和 开发 者 〈 内 部 ) 两 个 角度 来 回答 。 从 使 
用 者 观点 出 发 ， 需 要 系统 具有 易学 易 用 、 界 面 友 好 、 正 确 使 用 时 能 快速 给 出 正确 结果 、 效 率 高 
等 优点 ， 还 要 求 系统 安全 可 靠 等 ; 从 系统 开发 者 和 管理 者 角度 出 发 ， 要 求 系统 易于 修改 和 扩充 、 
易于 理解 、 易 于 测试 和 重用 、 易 于 与 其 他 系统 兼容 和 管理 等 。 虽 然 不 同 的 系统 所 强调 的 特性 可 
能 不 同 ， 但 上 述 所 要 求 的 系统 特性 是 基本 特性 。 

相对 而 言 ， 面 向 对 象 的 开发 技术 更 有 利于 开发 具有 上 述 特性 的 软件 系统 。 本 节 简 要 介绍 面 
向 对 象 开 发 技术 的 基本 概念 和 相关 步骤 。 


7.1.1 面向 对 象 的 基本 概念 


了 Peter Coad 和 Edward Yourdon 提出 用 下 面 的 等 式 识别 面向 对 象 方法 。 
面向 对 象 = 对 象 (Object) + 分 类 (Classification) + 继承 (Inheritance) + 通过 消息 的 通信 


(Communication with Messages ) 
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可 以 说 ， 采 用 这 4 个 概念 开发 的 软件 系统 是 面向 对 象 的 。 
1. 对象 


在 面向 对 象 的 系统 中 ， 对 和 象 是 基本 的 运行 时 的 实体 ， 它 既 包 括 数据 (属性 )， 也 包括 作用 
于 数据 的 操作 《行为 )。 所 以 ， 一 个 对 象 把 属性 和 行为 封装 为 一 个 整体 。 封 装 是 一 种 信息 隐蔽 
技术 ， 它 的 目的 是 使 对 象 的 使 用 者 和 生产 者 分 离 ， 使 对 象 的 定义 和 实现 分 开 。 从 程序 设计 者 来 
看 ， 对 象 是 一 个 程序 模块 ， 从 用 户 来 看 ， 对 象 为 他 们 提供 了 所 希望 的 行为 。 在 对 象 内 的 操作 通 
常 称 为 方法 。 一 个 对 象 通常 可 由 对 象 名 、 属 性 和 方法 3 个 部 分 组 成 。 

在 现实 世界 中 ， 每 个 实体 都 是 对 象 ， 如 学 生 、 汽 车 、 电 视 机 和 空调 等 都 是 现实 世界 中 的 对 
象 。 每 个 对 象 都 有 它 的 属性 和 操作 ， 如 电视 机 有 颜色 、 音 量 、 亮 度 、 灰 度 、 频 道 等 属性 ， 可 以 
有 切换 频道 、 增 大 /减低 音量 等 操作 。 电 视 机 的 属性 值 表 示 了 电视 机 所 处 的 状态 ， 而 这 些 属性 只 
能 通过 其 提供 的 操作 来 改变 。 电 视 机 的 各 组 成 部 分 ， 如 显像管 、 电 路 板 和 开关 等 都 封装 在 电视 
机 机 箱 中 ， 人 们 不 知道 也 不 关心 电视 机 是 如 何 实现 这 些 操作 的 。 


2. 消息 


对 象 之 间 进 行 通信 的 一 种 构造 叫 作 消 息 。 当 一 个 消息 发 送 给 某 个 对 象 时 ， 包 含 要 求 接收 对 
象 去 执行 某 些 活动 的 信息 。 接 收 到 信息 的 对 象 经 过 解释 ， 然 后 予以 响应 。 这 种 通信 机 制 称 为 消 
息 传递 。 发 送 消息 的 对 象 不 需要 知道 接收 消息 的 对 象 如 何 对 请 求 予 以 响应 。 


3. 类 


一 个 类 定义 了 一 组 大 体 上 相似 的 对 象 。 一 个 类 所 包含 的 方法 和 数据 描述 一 组 对 象 的 共同 行 
为 和 属性 。 把 一 组 对 象 的 共同 特征 加 以 抽象 并 存储 在 一 个 类 中 是 面向 对 象 技术 最 重要 的 一 点 。 
是 否 建立 了 一 个 丰富 的 类 库 ， 是 衡量 一 个 面向 对 象 程序 设计 语言 成 熟 与 否 的 重要 标志 。 

类 是 在 对 象 之 上 的 抽象 ， 对 象 是 类 的 具体 化 ， 是 类 的 实例 〈Instance)。 在 分 析 和 设计 时 ， 
通常 把 注意 力 集中 在 类 上 ， 而 不 是 具体 的 对 象 。 也 不 必 逐 个 定义 每 个 对 象 , 只 需 对 类 做 出 定义 ， 
而 对 类 的 属性 进行 不 同 赋值 即 可 得 到 该 类 的 对 象 实例 。 

类 可 以 分 为 三 种 : 实体 类 、 接 口 类 〈 边 界 类 ) 和 控制 类 。 实 体 类 的 对 象 表示 现实 世界 中 真 
实 的 实体 ， 如 入 、 物 等 。 接 口 类 〈 边 界 类 ) 的 对 象 为 用 户 提供 一 种 与 系统 合作 交互 的 方式 ， 分 
为 人 和 系统 两 大 类 ， 其 中 人 的 接口 可 以 是 显示 屏 、 窗 口 、Web 窗 体 、 对 话 框 、 菜 单 、 列 表 框 、 
其 他 显示 控制 、 条 形 码 、 二 维 码 或 者 用 户 与 系统 交互 的 其 他 方法 。 系 统 接口 涉及 到 把 数据 发 送 
到 其 他 系统 ， 或 者 从 其 他 系统 接收 数据 。 控 制 类 的 对 象 用 来 控制 活动 流 ， 充 当 协 调 者 。 

有 些 类 之 间 存在 一 般 和 特殊 关系 ， 即 一 些 类 是 某 个 类 的 特殊 情况 ， 某 个 类 是 一 些 类 的 一 般 
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情况 。 这 是 一 种 is-a 关系 ， 即 特殊 类 是 一 种 一 般 类 。 例 如 “汽车 ”类 “轮船 ” 类 “飞机 ”类 

都 是 一 种 “交通 工具 ”类 。 特 殊 类 是 一 般 类 的 子 类 ， 一 般 类 是 特殊 类 的 父 类 。 同 样 ,“ 汽 车 ” 

类 还 可 以 有 更 特殊 的 类 ， 如 “轿车 ”类 、“ 货 车 ”类 等 。 在 这 种 关系 下 形成 一 种 层次 的 关联 。 
通常 ， 把 一 个 类 和 这 个 类 的 所 有 对 象 称 为 “类 及 对 象 ”或 对 象 类 。 


4. 继承 


继承 是 父 类 和 子 类 之 间 共 享 数据 和 方法 的 机 制 。 这 是 类 之 间 的 一 种 关系 ,在 定义 和 实现 一 
个 类 的 时 候 ， 可 以 在 一 个 已 经 存在 的 类 的 基础 上 进行 ， 把 这 个 已 经 存在 的 类 所 定义 的 内 容 作 为 
自己 的 内 容 ， 并 加 入 若干 新 的 内 容 。 图 7-1 表 示 了 父 类 A 和 它 的 子 类 B 之 间 的 继承 关系 。 


图 7-1 类 的 继承 关系 


一 个 父 类 可 以 有 多 个 子 类 ， 这 些 子 类 都 是 父 类 的 特例 ， 父 类 描述 了 这 些 子 类 的 公共 属性 和 
方法 。 一 个 子 类 可 以 继承 它 的 父 类 (或 祖先 类 ) 中 的 属性 和 方法 ， 这 些 属性 和 操作 在 子 类 中 不 
必定 义 ， 子 类 中 还 可 以 定义 自己 的 属性 和 方法 。 

图 7-1 中 的 B 只 从 一 个 父 类 A 得 到 继承 ， 叫 作 “ 单 重 继承 ”。 如 果 一 个 子 类 有 两 个 或 更 多 
个 父 类 ， 则 称 为 “多 重 继承 ”。 

S. 多 态 


在 收 到 消息 时 ， 对 象 要 予以 响应 。 不 同 的 对 象 收 到 同一 消息 可 以 产生 完全 不 同 的 结果 ， 这 
一 现象 称 为 多 态 (Polymorphism)。 在 使 用 多 态 的 时 候 ， 用 户 可 以 发 送 一 个 通用 的 消息 ， 而 实现 
的 细节 则 由 接收 对 象 自行 决定 。 这 样 ， 同 一 消息 就 可 以 调用 不 同 的 方法 。 

多 态 的 实现 受到 继承 的 支持 ， 利 用 类 的 继承 的 层次 关系 ， 把 具有 通用 功能 的 消息 存放 在 高 
层次 ， 而 不 同 的 实现 这 一 功能 的 行为 放 在 较 低层 次 ， 在 这 些 低 层次 上 生成 的 对 象 能 够 给 通用 消 
息 以 不 同 的 响应 。 


国 3s4 荐 。 软 人 设计 师 教程 (第 5 版 ) 


多 态 有 不 同 的 形式 ，Cardelli 和 Wegner 把 它 分 为 4 类 ， 如 下 所 示 。 其 中 ， 参 数 多 态 和 包含 
多 态 称 为 通用 的 多 态 ， 过 载 多 态 和 强制 多 态 称 为 特定 的 多 态 。 


参数 多 态 是 应 用 比较 广泛 的 多 态 ， 被 称 为 最 纯 的 多 态 。 包 含 多 态 在 许多 语言 中 都 存在 ， 最 
常见 的 例子 就 是 子 类 型 化 ， 即 一 个 类 型 是 另 一 个 类 型 的 子 类 型 。 过 载 (Overloading) 多 态 是 同 
一 个 名 字 在 不 同 的 上 下 文中 所 代表 的 含义 不 同 。 


6. 动态 绑 定 (Dynamic Binding) 


绑 定 是 一 个 把 过 程 调用 和 响应 调用 所 需要 执行 的 代码 加 以 结合 的 过 程 。 在 一 般 的 程序 设计 
语言 中 ， 绑 定 是 在 编译 时 进行 的 ， 叫 作 静 态 绑 定 。 动 态 绑 定 则 是 在 运行 时 进行 的 ， 因 此 ， 一 个 
给 定 的 过 程 调用 和 代码 的 结合 直到 调用 发 生 时 才 进 行 。 

动态 绑 定 是 和 类 的 继承 以 及 多 态 相 联系 的 。 在 继承 关系 中 ， 子 类 是 父 类 的 一 个 特例 ， 所 以 
父 类 对 象 可 以 出 现 的 地 方 ， 子 类 对 象 也 可 以 出 现 。 因 此 在 运行 过 程 中 ， 当 一 个 对 象 发 送 消息 请 
求 服务 时 ， 要 根据 接收 对 象 的 具体 情况 将 请 求 的 操作 与 实现 的 方法 进行 连接 ， 即 动态 绑 定 。 


7.1.2 面向 对 象 分 析 


同 其 他 分 析 方 法 一 样 ， 面 向 对 象 分 析 (Object-Oriented Analysis，OOA) 的 目的 是 为 了 获 
得 对 应 用 问题 的 理解 。 理 解 的 目的 是 确定 系统 的 功能 、 性 能 要 求 。 面 向 对 象 分 析 方 法 与 功能 / 
数据 分 析 法 之 间 的 差别 是 前 期 的 表述 含义 不 同 。 功能 /数据 分 析 法 分 开 考虑 系统 的 功能 要 求 和 数 
据 及 其 结构 ， 面 向 对 象 分 析 方 法 是 将 数据 和 功能 结合 在 一 起 作为 一 个 综合 对 象 来 考虑 。 面 向 对 
象 分 析 技 术 可 以 将 系统 的 行为 和 信息 间 的 关系 表示 为 迭代 构造 特征 。 

面向 对 象 分 析 包 含 5 个 活动 : 认定 对 象 、 组 织 对 象 、 描 述 对 象 间 的 相互 作用 、 确 定 对 象 的 
操作 、 定 义 对 象 的 内 部 信息 。 

1. 认定 对 象 

在 应 用 领域 中 ， 按 自然 存在 的 实体 确立 对 象 。 在 定义 域 中 ， 首 先 将 自然 存在 的 “名 词 ” 作 
为 一 个 对 象 ， 这 通常 是 研究 问题 、 定 义 域 实体 的 良好 开始 。 通 过 实体 间 的 关系 寻找 对 象 常常 没 
有 问题 ， 困 难 在 于 寻找 (选择 ) 系统 关心 的 实质 性 对 象 ， 实 质 性 对 象 是 系统 稳定 性 的 基础 。 例 
如 在 银行 应 用 系统 中 ， 实 质 性 对 象 应 包含 客户 账 务 、 清 算 等 ， 而 门卫 值班 表 不 是 实质 性 对 象 ， 


第 7 章 面向 对 象 技术 “图 355 荐 


甚至 可 不 包含 在 该 系统 中 。 
2. 组 织 对 象 


分 析 对 象 间 的 关系 ， 将 相关 对 象 抽 象 成 类 ， 其 目的 是 为 了 简化 关联 对 象 ， 利 用 类 的 继承 性 
建立 具有 继承 性 层次 的 类 结构 。 抽 象 类 时 可 从 对 象 间 的 操作 或 一 个 对 象 是 另 一 个 对 象 的 一 部 分 
来 考虑 ， 如 房子 是 由 门 和 窗 构 成 的 。 由 对 象 抽象 类 ， 通 过 相关 类 的 继承 构造 类 层次 ， 所 以 说 系 
统 的 行为 和 信息 间 的 分 析 过 程 是 一 种 迭代 表征 过 程 。 


3. 对 象 间 的 相互 作用 


描述 出 各 对 象 在 应 用 系统 中 的 关系 ， 如 一 个 对 象 是 另 一 个 对 象 的 一 部 分 ， 一 个 对 象 与 其 他 
对 象 间 的 通信 关系 等 。 这 样 可 以 完整 地 描述 每 个 对 象 的 环境 ， 由 一 个 对 象 解释 另 一 个 对 象 ， 以 
及 一 个 对 象 如 何 生成 另 一 个 对 象 ， 最 后 得 到 对 象 的 界面 描述 。 


4. 基于 对 象 的 操作 


当 考虑 对 象 的 界面 时 ， 自 然 要 考虑 对 象 的 操作 。 其 操作 有 从 对 象 直接 标识 的 简单 操作 ， 如 
创建 、 增 加 和 删除 等 ， 也 有 更 复杂 的 操作 ， 如 将 几 个 对 象 的 信息 连接 起 来 。 一 般 而 言 ， 避 免 对 
象 太 复杂 比较 好 ， 当 连接 的 对 象 太 复杂 时 ， 可 将 其 标识 为 新 对 象 。 当 确定 了 对 象 的 操作 后 ， 再 
定义 对 象 的 内 部 ， 对 象 内 部 定义 包括 其 内 部 数据 信息 、 信 息 存 储 方法 、 继 承 关 系 以 及 可 能 生成 
的 实例 数 等 属性 。 

分 析 阶 段 最 重要 的 是 理解 问题 域 的 概念 ， 其 结果 将 影响 整个 工作 。 经 验 表 明 ， 从 应 用 定义 
域 概念 标识 对 象 是 非常 合理 的 ， 完 成 上 述 工作 后 写 出 规范 文档 ， 文 档 确 定 每 个 对 象 的 范围 。 

早期 面向 对 象 的 目标 之 一 是 简化 模型 与 问题 域 之 间 的 语义 差距 。 事 实 上 ， 面 向 对 象 分 析 的 
基础 是 软件 系统 结构 ， 这 依赖 于 人 类 看 待 现实 世界 的 方法 。 当 人 们 理解 求解 问题 的 环境 时 ， 常 
采用 对 象 、 分 类 法 和 层次 性 这 类 术语 。 面 向 对 象 分 析 与 功能 /数据 分 析 方法 相 比 ， 面 向 对 象 的 结 
果 比 较 容易 理解 和 管理 。 面 向 对 象 分 析 方 法 的 另 一 个 优点 是 便于 修改 ， 早 期 阶段 的 修改 容易 提 
高 软件 的 可 靠 性 。 

7.1.3 面向 对 象 设计 

面向 对 象 设计 (Object-Oriented Design，OOD) 是 将 OOA 所 创建 的 分 析 模 型 转化 为 设计 
模型 ， 其 目标 是 定义 系统 构造 蓝图 。 通 常 的 情况 是 ， 由 概念 模型 生成 的 分 析 模型 被 装 入 到 相应 
的 执行 环境 中 时 ， 需 要 考虑 实现 问题 加 以 调整 和 增补 ， 如 根据 所 用 编程 语言 是 否 支 持 多 继承 或 
继承 ， 而 调整 类 结构 。OOA 与 OOD 之 间 不 存在 鸿沟 ， 采 用 一 致 的 概念 和 一 致 的 表示 法 ，OOD 
同样 应 遵循 抽象 、 信 息 隐藏 、 功 能 独立 、 模 块 化 等 设计 准则 。 
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1. 面向 对 象 设计 的 活动 


OOD 在 复 用 OOA 模型 的 基础 上 ， 包 含 与 OOA 对 应 如 下 五 个 活动 。 

(1) 识别 类 及 对 象 。 

(2) 定义 属性 。 

(3) 定义 服务 。 

(4) 识别 关系 。 

(5) 识别 包 。 

和 所 有 其 他 设计 活动 一 样 ， 要 使 系统 的 结构 好 且 效 率 高 ， 做 好 相互 间 的 平衡 是 困难 的 。 分 
析 模 型 已 经 提供 了 概念 结构 ， 它 将 试图 长 期 保存 。 另 外 ， 设 计 期 必须 充分 考虑 系统 的 稳定 性 ， 
如 目标 环境 所 需 的 最 大 存储 空间 、 可 靠 性 和 响应 时 间 等 ， 所 有 这 些 都 会 影响 系统 的 结构 。 

对 象 标识 期 间 的 目标 是 分 析 对 象 ， 设 计 过 程 也 是 发 现 对 象 的 过 程 ， 称 之 为 再 处 理 ， 并 补充 
几 个 新 的 组 成 部 分 ， 即 与 实现 有 关 的 因素 : 图 形 用 户 界面 系统 ， 硬 件 操作 系统 及 网 络 ， 数 据 答 
理 系统 以 及 编程 语言 和 可 复 用 构件 库 等 。OOD 应 该 尽 可 能 隔离 实现 条 件 对 系统 的 影响 , 对 不 可 
隔离 的 因素 按 实现 条 件 调整 OOA 模型 。 因 此 ， 必 须 有 从 分 析 模 型 到 设计 模型 到 程序 设计 语言 
的 线性 转换 规则 。 对 象 可 以 用 预先 开发 的 源 代码 实现 ， 称 这 样 的 部 分 为 构件 (Component)。 由 
于 这 些 构 件 是 功能 和 数据 的 组 装 ， 因 此 ， 常 常用 于 简化 面向 对 象 环境 的 产生 。 

如 前 所 述 ， 面 向 对 象 系统 的 开发 需要 面向 对 象 的 程序 设计 风格 ， 这 与 面向 对 象 程序 设计 语 
言 无 直接 关系 。 面 向 对 象 是 一 种 程序 设计 风格 ， 而 不 只 是 一 种 具有 构造 继承 性 、 封 装 性 和 多 态 
的 程序 设计 语言 族 的 命名 。 

2. 面向 对 象 设计 的 原则 


(1) 单一 责任 原则 (Single Responsibility Principle，SRP)。 就 一 个 类 而 言 ， 应 该 仅 有 一 个 
引起 它 变 化 的 原因 。 即 ， 当 需要 修改 某 个 类 的 时 候 原因 有 且 只 有 一 个 ， 让 一 个 类 只 做 一 种 类 型 
责任 。 

(2) 开放 -封闭 原则 (Open & Close Principle，OCP)。 软 件 实体 〈 类 、 模 块 、 函 数 等 ) 应 
该 是 可 以 扩展 的 ， 即 开放 的 ;但 是 不 可 修改 的 ， 即 封闭 的 。 

(3) 里 氏 替 换 原 则 (Liskov Substitution Principles，LSP)。 子 类 型 必须 能 够 替换 掉 他 们 的 基 
类 型 。 即 ， 在 任何 父 类 可 以 出 现 的 地 方 ， 都 可 以 用 子 类 的 实例 来 赋值 给 父 类 型 的 引用 。 当 一 个 
子 类 的 实例 应 该 能 够 替换 任何 其 超 类 的 实例 时 ， 它 们 之 间 才 具有 是 一 个 〈is-a) 关系 。 

(4) 依赖 倒置 原则 (Dependence Inversion Principle， DIP)。 抽 象 不 应 该 依赖 于 细节 ， 细 
节 应 该 依赖 于 抽象 。 即 ， 高 层 模块 不 应 该 依赖 于 低层 模块 ， 二 者 都 应 该 依赖 于 抽象 。 
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(5) 接口 分 离 原则 (Interface Segregation Principle，ISP)。 不 应 该 强迫 客户 依赖 于 它们 不 
用 的 方法 。 接 口 属于 客户 ， 不 属于 它 所 在 的 类 层次 结构 。 即 : 依赖 于 抽象 ， 不 要 依赖 于 具体 ， 
同时 在 抽象 级 别 不 应 该 有 对 于 细节 的 依赖 。 这 样 做 的 好 处 就 在 于 可 以 最 大 限度 地 应 对 可 能 的 

上 述 (1) 一 (5) 是 面向 对 象 方法 中 的 五 大 原则 。 除 了 这 五 大 原则 之 外 ，Robert C. Martin 
提出 的 面向 对 象 设计 原则 还 包括 以 下 几 个 。 

(6) 重用 发 布 等 价 原则 (Release Reuse Equivalency Principle，REP)。 重 用 的 粒度 就 是 发 布 
的 粒度 。 

(7) 共同 封闭 原则 (Common Closure Principle，CCP)。 包 中 的 所 有 类 对 于 同一 类 性 质 的 
变化 应 该 是 共同 封闭 的 。 一 个 变化 若 对 一 个 包产 生 影 响 ， 则 将 对 该 包 中 的 所 有 类 产生 影响 ， 而 
对 于 其 他 的 包 不 造成 任何 影响 。 

(8) 共同 重用 原则 (Common Reuse Principleg，CRP)。 一 个 包 中 的 所 有 类 应 该 是 共同 重用 
的 。 如 果 重 用 了 包 中 的 一 个 类 ， 那 么 就 要 重用 包 中 的 所 有 类 。 

(9) 无 环 依赖 原则 (Acyclic Dependencies Principle，ADP)。 在 包 的 依赖 关系 图 中 不 允许 存 
在 环 ， 即 包 之 间 的 结构 必须 是 一 个 直接 的 五 环 图 形 。 

(10) 稳定 依赖 原则 (Stable Dependencies Principle，SDP)。 朝 着 稳定 的 方向 进行 依赖 。 

(11) 稳定 抽象 原则 (Stable Abstractions Principle，SAP)。 包 的 抽象 程度 应 该 和 其 稳定 程 
度 一 致 。 

7.1.4 面向 对 象 程序 设计 


程序 设计 范 型 (Programming Paradigm) 是 人 们 在 程序 设计 时 所 采用 的 基本 方式 模型 ， 决 
定 了 程序 设计 时 采用 的 思维 方式 、 使 用 的 工具 ， 同 时 又 有 一 定 的 应 用 范畴 。 其 发 展 经 历 了 过 程 
程序 设计 、 模 块 化 程序 设计 、 函 数 程序 设计 、 罗 辑 程序 设计 ， 发 展 到 现在 的 面向 对 象 程序 设计 

面向 对 象 程序 设计 (Object-Oriented Programming，OOP) 的 实质 是 选用 一 种 面向 对 象 程序 
设计 语言 (ObjectOriented Programming Language，OOPL)， 采 用 对 象 、 类 及 其 相关 概念 所 进 
行 的 程序 设计 。 它 的 关键 在 于 加 入 了 类 和 继承 性 ， 从 而 进一步 提高 了 抽象 程度 。 特 定 的 OOP 
概念 一 般 是 通过 OOPL 中 特定 的 语言 机 制 来 体现 的 。 本 节 以 C++ 语言 为 主 从 程序 设计 的 角度 进 
一 步 讨论 这 些 概念 。 

OOP 现在 已 经 扩展 到 系统 分 析 和 软件 设计 的 范畴 , 出 现 了 面向 对 象 分 析 和 面向 对 象 设计 的 
概念 ， 这 两 部 分 内 容 见 本 节 的 7.1.2 和 7.1.3 两 小 节 。 
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1. 类 


通常 ， 在 介绍 OOP 的 书籍 或 文章 中 总 是 先 引入 对 象 的 概念 ， 然 后 从 对 对 象 进行 抽象 的 角 
度 来 引入 类 的 概念 。 但 是 ， 当 设计 和 实现 一 个 面向 对 象 的 程序 时 ， 首 先 接触 到 的 不 是 对 象 ， 而 
是 类 和 类 层次 结构 。 

【 例 7.1】 雇员 类 的 定义 。 


class Employee { 
private: 
访问 控制 符 | 
mitAsge; 


public: 
void Change(char *name, int age); 


成 员 函 数 void Retire(); 


Employee(char *name, int age); // 实 例 生成 函数 (Constructor) 
~Employee0; /实例 消除 函数 (Destructor) 
$3 
类 具有 实例 化 功能 , 包括 实例 生成 (由 类 的 Constructor 完成 ) 和 实例 消除 (由 类 的 Destructor 
完成 )。 类 的 实例 化 功能 决定 了 类 及 其 实例 具有 下 面 的 特征 。 
(1) 同一 个 类 的 不 同 实例 具有 相同 的 数据 结构 ， 承 受 的 是 同一 方法 集合 所 定义 的 操作 ， 因 
而 具有 规律 相同 的 行为 。 
(2) 同一 个 类 的 不 同 实例 可 以 持 有 不 同 的 值 ， 因 而 可 以 具有 不 同 的 状态 。 
(3) 实例 的 初始 状态 ( 初 值 ) 可 以 在 实例 化 时 确定 。 


2. 继承 和 类 层次 结构 


孤立 的 类 只 能 描述 实体 集合 的 特征 同一 性 , 而 客观 世界 中 实体 集合 的 划分 通常 还 要 考虑 实 
体 特 征 方面 有 关联 的 相似 性 。 在 OOP 中 使 用 继承 机 制 解决 这 一 问题 。 

在 OOPL 中 ， 继 承 一 般 通 过 定义 类 之 间 的 关系 来 体现 。 

在 一 个 面向 对 象 系统 中 ， 子 类 与 父 类 之 间 的 继承 关系 构成 了 这 个 系统 的 类 层次 结构 ， 可 以 
用 树 〈 对 应 于 单 继承 ) 或 格 〈 对 应 于 多 继承 ) 这 样 的 图 来 描述 。 

【 例 7.2】 经 理 类 的 定义 。 


class Manager : public Emplyee { 
int Level: 
public: 
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void ChangeLevel(int n); 
Manager(char *name, int age, int level); 


~Manager() 

当 执 行 一 个 子 类 的 实例 生成 方法 时 ,首先 在 类 层次 结构 中 从 该 子 类 沿 继承 路 径 上 济 至 它 的 
一 个 基 类 ， 然 后 自 项 向 下 执行 该 子 类 所 有 父 类 的 实例 生成 方法 ， 最 后 执行 该 子 类 实例 生成 方法 
的 函数 体 。 当 执行 一 个 子 类 的 实例 消除 方法 时 ， 顺 序 恰 好 与 执行 该 子 类 实例 生成 方法 相反 : 先 
执行 该 子 类 实例 消除 方法 的 函数 体 ， 再 沿 继承 路 径 自 底 向 上 执行 该 子 类 所 有 父 类 的 实例 消除 
方法 。 

与 一 般 数据 类 型 的 实例 化 过 程 相 比 ， 类 的 实例 化 过 程 是 一 种 实例 的 合成 过 程 ， 而 不 仅仅 是 
根据 单个 类 型 进行 的 空间 分 配 、 初 始 化 和 绑 定 。 

OOPL 中 的 继承 机 制 体现 了 一 条 重要 的 面向 对 象 程序 设计 原则 : 开发 人 员 在 构造 程序 时 不 
必 从 零 开始 ， 而 只 需 对 差别 进行 程序 设计 。 支 持 继承 也 是 OOPL 与 传统 程序 设计 语言 在 语言 机 
制 方面 最 根本 的 区 别 。 

3 对象、 消息 传递 和 方法 


对 象 是 类 的 实例 。 尽 管 对 象 的 表示 在 形式 上 与 一 般 数据 类 型 十 分 相似 , 但 是 它们 之 间 存 在 
一 种 本 质 区 别 : 对 象 之 间 通 过 消息 传递 方式 进行 通信 。 

消息 传递 源 是 一 种 与 通信 有 关 的 概念 , OOP 使 得 对 象 具有 交互 能 力 的 主要 模型 就 是 消息 传 
递 模 型 。 对 和 象 被 看 成 用 传递 消息 的 方式 互相 联系 的 通信 实体 ， 它 们 既 可 以 接收 ， 也 可 以 拒绝 外 
界 发 来 的 消息 。 

一 般 情况 下 ， 对 象 接收 它 能 够 识别 的 消息 ， 拒 绝 它 不 能 识别 的 消息 。 对 于 一 个 对 象 而 言 ， 
任何 外 部 的 代码 都 不 能 以 任何 不 可 预知 或 事先 不 允许 的 方式 与 这 个 对 象 进 行 交 互 。 

发 送 一 条 消息 至 少 应 给 出 一 个 对 象 的 名 字 和 要 发 给 这 个 对 象 的 那 条 消息 的 名 字 。 通 常 ， 消 
息 的 名 字 就 是 这 个 对 象 中 外 界 可 知 的 某 个 方法 的 名 字 。 在 消息 中 ， 经 常 还 有 一 组 参数 〈 也 就 是 
那个 方法 所 要 求 的 参数 )， 将 外 界 的 有 关 信 息 传 给 这 个 对 象 。 

对 于 一 个 类 来 说 ， 它 关于 方法 界面 的 定义 规定 了 实例 的 消息 传递 协议 ， 而 它 本 身 则 决定 了 
消息 传递 的 合法 范围 。 由 于 类 是 先 于 对 象 构 造 而 成 的 ， 所 以 一 个 类 为 它 实例 提供 了 可 以 预知 的 
交互 方式 。 例 如 ， 假 设 ml 是 类 Manager 的 一 个 实例 〈 或 对 象 )， 当 外 界 要 求 把 这 个 对 象 所 代表 
的 那 位 经 理 的 级 别 改变 为 2 时， 就 应 以 下 面 的 方式 向 这 个 对 象 发 出 一 条 消息 : 


ml.ChangeLevel(2); 
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4. 对 象 自身 引用 


对 象 自身 引用 (selfReference) 是 OOPL 中 的 一 种 特有 结构 。 这 种 结构 在 不 同 的 OOPL 中 
有 不 同 的 名 称 , 在 C++ 和 Java 中 称 为 this, 在 Smalltalk-80、Object-C 和 其 他 一 些 OOPL 中 则 称 
为 self。 

以 C++ 语言 为 例 , 对 于 类 c 和 方法 c:m, 在 c::m 方法 体 中 出 现 的 c 的 成 员 名 n 将 被 编译 程 
序 按 this->n 来 对 待 。 这 里 的 this 是 一 个 类 型 为 c* 的 指针 (在 Java 语言 中 this 是 一 个 引用 )， 它 
的 值 由 语言 中 的 消息 传递 机 制 提供 。 

对 象 自身 引用 的 值 和 类 型 分 别 扮演 了 两 种 意义 的 角色 : 对 象 自身 引用 的 值 使 得 方法 体 中 引 
用 的 成 员 名 与 特定 的 对 象 相关 ， 对 象 自身 引用 的 类 型 则 决定 了 方法 体 被 实际 共享 的 范围 。 

对 象 自身 引用 机 制 使 得 在 进行 方法 的 设计 和 实现 时 并 不 需要 考虑 与 对 象 联系 的 细节 ， 而 是 
从 更 高 一 级 的 抽象 层次 ， 也 就 是 类 的 角度 来 设计 同类 型 对 象 的 行为 特征 ， 从 而 使 得 方法 在 一 个 
类 及 其 子 类 的 范围 内 具有 共性 。 在 程序 运行 过 程 中 ， 消 息 传递 机 制 和 对 象 自身 引用 将 方法 与 特 
定 的 对 象 动态 地 联系 在 一 起 ， 使 得 不 同 的 对 象 在 执行 同样 的 方法 体 时 ， 可 以 因 对 象 的 状态 不 同 
而 产生 不 同 的 行为 ， 从 而 使 得 方法 对 具体 的 对 象 具 有 个 性 。 


S$. 重 置 


重 置 或 覆盖 〈Overriding) 是 在 子 类 中 重新 定义 父 类 中 已 经 定义 的 方法 ， 其 基本 思想 是 通 
过 一 种 动态 绑 定 机 制 的 支持 ， 使 得 子 类 在 继承 父 类 接口 定义 的 前 提 下 用 适合 自己 要 求 的 实现 去 
置换 父 类 中 的 相应 实现 。 

在 OOPL 中 , 重 置 机 制 有 相应 的 语法 供 开发 人 员 选 择 使 用 。 在 C++ 语言 中 ， 通 过 虚拟 函数 
(Virtual Function) 的 定义 来 进行 重 置 的 声明 ， 通 过 虚拟 函数 跳 转 表 (Virtual Functions Jump 
Tables，VTBL) 结构 来 实现 重 署 方法 体 的 动态 绑 定 。 在 Java 语言 中 ， 通 过 抽象 方法 (Abstract 
Method) 进行 重 置 的 声明 ， 通 过 方法 查找 (Method Lookup ) 实现 重 置 方法 体 的 动态 绑 定 。 

下 面 以 C++ 语言 为 例 ， 说 明 重 置 机 制 的 使 用 。 

【 例 7.3】 使 用 重 置 修改 类 Employee 和 Manager。 


class Employee { 
protected: 
char *Name; 
int Age; 
public: 
void Change(char * name, int age): 
virtual void Retire(); /虚拟 函数 
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Employee(char *name, int age): 
~Employee0; 
$B 
class Manager : public Employee { 
int Level; 
public: 
void Retire0: // 重 置 从 父 类 继承 的 Retire 方法 
virtual void ChangeLevel(int n); // 虚 拟 函数 ， 供 Manager 的 子 类 重 置 
Manager(char *name, int age, int level):; 


~Manager(); 
; 


6. 类 属 类 


类 属 是 程序 设计 语言 中 普遍 注重 的 一 种 参数 多 态 机 制 ,在 OOPL 中 也 不 例外 。 本 节 主 要 介 
绍 与 类 有 关 的 类 属 。 

在 C++ 语言 中 ， 类 属 有 专门 的 术语 一 一 template。 
【 例 7.4】 类 属 类 。 
template <class T> class Vector { 

T *v; 

int sz; 

public: 

T& operator[](int D); /运算 符 过 载 

Vector(int VectorSize); 

人/ 


}; 
其 中 ，<class T> 中 的 class 用 来 说 明了 是 一 个 类 型 参数 ， 但 并 不 意味 着 了 一 定 是 一 个 类 ， 也 可 
以 是 基本 类 型 。 

类 属 类 可 以 看 成 是 类 的 模板 。 一 个 类 属 类 是 关于 一 组 类 的 一 个 特性 抽象 ， 它 强调 的 是 这 些 
类 的 成 员 特 征 中 与 具体 类 型 无 关 的 那些 部 分 ， 而 与 具体 类 型 相关 的 那些 部 分 则 用 变 元 来 表示 。 
这 就 使 得 对 类 的 集合 也 可 以 按照 特性 的 相似 性 再 次 进行 划分 。 类 属 类 的 一 个 重要 作用 ， 就 是 对 
类 库 的 建设 提供 了 强 有 力 的 支持 。 
重 置 和 类 属 都 是 一 种 多 态 机 制 ， 多 态 的 基本 概念 以 及 多 态 的 分 类 见 本 章 7.1 节 ， 对 于 其 他 
种 类 的 多 态 不 在 本 节 进 行 介绍 。 
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7. 无 实例 的 类 
在 前 几 节 中 曾 指出 ， 类 是 对 象 的 模板 ， 对 象 是 类 的 实例 。 那 么 是 否 每 个 类 都 至 少 有 一 个 实 


例 ? 如 果 在 类 之 间 没 有 定义 继承 关系 ， 回 答 是 肯定 的 。 这 是 因为 若 存 在 没有 实例 的 类 ， 那 么 这 
样 的 类 对 程序 的 行为 没有 任何 贡献 ， 因 而 是 兄 余 的 。 相 反 ， 如 果 存 在 继承 关系 ， 那 么 的 确 有 可 


在 类 层次 结构 的 较 高 层次 上 看 到 始终 没有 实例 的 类 。 


要 创建 无 实例 的 类 ， 仍 然 需 要 语言 的 支持 。 在 CH+ 和 Java 语言 中 ， 抽 象 类 就 是 这 样 的 类 。 


在 C++ 中 通过 在 类 中 定义 纯 虚 拟 函 数 来 创建 一 个 抽象 类 , 在 Java 中 通过 将 一 个 类 声明 为 抽象 类 
来 创建 一 个 抽象 类 ， 并 在 抽象 类 中 定义 抽象 方法 ， 抽 象 类 中 也 可 以 没有 抽象 方法 。 


下 


1 


【 例 7.5】 用 C++ 语言 创建 抽象 类 。 


class Person { /抽象 类 
protected: 
char *Name; 
/* .oe/ 
public: 
void Change(char *name, int age): 
Virtual void PrintOnO =0;  // 纯 虚拟 函数 
Person(); 
Person(char *name, int age, char *addr, char *tele); // 过 载 的 构造 函数 
~Person(); 


上 
【 例 7.6】 用 Java 语言 创建 抽象 类 。 


abstract class Person { /抽象 类 

protected String Name: 

/* ... #/ 

public void Change(String name, int age){*…} 

public abstract void PrintOn0; /抽象 方法 

public PersonO{**} 

public Person(String name, int age, String addr String tele){*…} 
} 


.5 面向 对 象 测试 


就 测试 而 言 ， 用 面向 对 象 方法 开发 的 系统 测试 与 其 他 方法 开发 的 系统 测试 没有 什么 不 同 ， 
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在 所 有 开发 系统 中 都 是 根据 规范 说 明 来 验证 系统 设计 的 正确 性 。 程 序 验证 应 尽 可 能 早 地 开始 。 
程序 调试 步骤 是 从 最 底层 开始 ， 从 单元 测试 、 综 合 测试 到 系统 测试 。 单 元 测试 是 系统 构件 的 分 
体 测 试 。 将 测试 好 的 系统 构件 接 起 来 看 它们 之 间 相 互 作 用 的 正确 性 称 为 综合 测试 。 最 后 是 整个 
系统 的 测试 ， 包 括 软 件 系统 所 在 相关 环境 的 测试 。 通 常 综合 测试 是 一 种 “主攻 ”活动 ， 在 系统 
发 期 是 非常 关键 的 。 这 一 阶段 应 随时 连接 已 开发 的 每 一 部 分 , 再 看 它们 的 实际 工作 , 这 种 “ 主 
攻 ” 活 动 在 面向 对 象 系统 中 是 一 种 实质 性 的 、 渐 渐 增长 的 测试 策略 。 

面向 对 象 的 系统 由 一 些 对 象 和 它们 相互 间 的 通信 组 成 , 这些 对 象 包括 了 它们 的 数据 属性 和 
操作 (动作 )， 比 传统 系统 开发 方法 中 独立 工作 的 子 程序 大 。 对 象 的 操作 局 限于 特定 数据 ， 一 
个 对 象 的 所 有 操作 自然 由 同一 个 设计 者 开发 。 这 导致 单元 测试 比 传统 系统 的 单元 大 ， 综 合 测试 
尽 可 能 在 早期 阶段 处 理 ， 因 为 通信 是 系统 开发 的 实质 。 所 有 对 象 有 预定 义 的 界面 ， 这 也 有 利于 
综合 测试 。 当 综合 测试 继续 到 较 高 层次 时 ， 那 么 越 来 越 多 的 对 象 就 会 被 逐步 连接 起 来 。 面 向 对 
象 的 综合 测试 是 由 底 向 上 的 测试 。 

一 般 来 说 ， 对 面向 对 象 软件 的 测试 可 分 为 下 列 4 个 层次 进行 。 

(1) 算法 层 。 测 试 类 中 定义 的 每 个 方法 ， 基 本 上 相当 于 传统 软件 测试 中 的 单元 测试 。 

(2) 类 层 。 测 试 封装 在 同一 个 类 中 的 所 有 方法 与 属性 之 间 的 相互 作用 。 在 面向 对 象 软件 中 
类 是 基本 模块 ， 因 此 可 以 认为 这 是 面向 对 象 测试 中 所 特有 的 模块 测试 。 

(3) 模板 层 。 测 试 一 组 协同 工作 的 类 之 间 的 相互 作用 ， 大 体 上 相当 于 传统 软件 测试 中 的 集 
成 测试 ， 但 是 也 有 面向 对 象 软件 的 特点 (例如 ， 对 和 象 之 间 通 过 发 送 消息 相互 作用 )。 

(4) 系统 层 。 把 各 个 子 系统 组 装 成 完整 的 面向 对 象 软件 系统 , 在 组 装 过 程 中 同时 进行 测试 。 

软件 工程 中 传统 的 测试 用 例 设 计 技 术 ， 如 逻辑 覆盖 、 等 价 类 划分 和 边界 值 分 析 等 方法 ， 仍 
然 可 以 作为 测试 类 中 每 个 方法 的 主要 技术 。 面 向 对 象 测试 的 主要 目标 也 是 用 尽 可 能 低 的 测试 成 
本 和 尽 可 能 少 的 测试 用 例 ， 发 现 尽 可 能 多 的 错误 。 但是， 面向 对 象 程序 中 特有 的 封装 、 继 承 和 
多 态 等 机 制 ， 也 给 面向 对 象 测试 带 来 一 些 新 特点 ， 增 加 了 测试 和 调试 的 难度 。 


7.2 UML 


面向 对 象 分 析 强 调 的 是 对 一 个 系统 中 对 象 的 特征 和 行为 的 定义 。 目 前 ， 国 际 上 已 经 出 现 了 
多 种 面向 对 象 的 方法 , 例如 Peter Coad 和 Edward Yourdon 的 OOA 和 OOD 方法 .Booch 的 OOD 
方法 、OMT (Object Modeling Technique， 面 向 对 象 建 模 技 术 ) 方法 及 UML (Unified Modeling 
Language， 统 一 建 模 语言 )。 本 节 将 对 目前 业界 普遍 接受 的 UML 方法 进行 简要 介绍 。 

统一 建 模 语言 是 面向 对 象 软件 的 标准 化 建 模 语言 。 由 于 其 简单 、 统 一 ， 又 能 够 表达 软件 设 
计 中 的 动态 和 静态 信息 ， 目 前 已 经 成 为 可 视 化 建 模 语言 事实 上 的 工业 标准 ， 当 前 版 本 为 2.4.1。 

从 企业 信息 系统 到 基于 Web 的 分 布 式 应 用 ,甚至 严格 的 实时 嵌入 式 系统 都 适合 用 UML 来 
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建 模 。 它 是 一 种 富有 表达 力 的 语言 ， 可 以 描述 开发 所 需要 的 各 种 视图 ， 然 后 以 此 为 基础 装配 系 
统 。UML 由 3 个 要 素 构成 : UML 的 基本 构造 块 、 支 配 这 些 构造 块 如 何 放置 在 一 起 的 规则 和 运 
用 与 整个 语言 的 一 些 公共 机 制 。 限 于 篇 幅 ， 下 面 仅 对 UML 中 的 基本 构造 块 进行 讨论 。 

UML 的 词汇 表 包 含 3 种 构造 块 : 事物 、 关 系 和 图 。 事 物 是 对 模型 中 最 具有 代表 性 的 成 分 
的 抽象 ， 关系 把 事物 结合 在 一 起 ， 图 聚集 了 相关 的 事物 。 


7.2.1 事物 


UML 中 有 4 种 事物 : 结构 事物 、 行 为 事物 、 分 组 事物 和 注释 事物 。 

(1) 结构 事物 (Structural Thing)。 结 构 事物 是 UML 模型 中 的 名 词 。 它 们 通常 是 模型 的 静 
态 部 分 , 描述 概念 或 物理 元 素 。 结构 事物 包括 类 (Class)、 接口 (Interface)、 协作 (Collaboration)、 
用 例 (Use Case)、 主 动 类 (Active Class)、 构 件 (Component)、 制 品 (Artifact) 和 结 点 (Node)。 

各 种 结构 事物 的 图 形 化 表示 如 图 7-2 所 示 。 


国 也 二 
-局 任 O EE (协作 各 ) 
接口 


接口 
类 协作 用 例 
主动 类 <componenty 加 本 
-属性 构件 名 人 D 结 点 名 
+ 方法 () 
主动 类 构件 制品 结 点 


图 7-2 结构 事物 的 图 形 表示 
(2) 行为 事物 (Behavior thing)。 行为 事物 是 UML 模型 的 动态 部 分 。 它 们 是 模型 中 的 动词 ， 
描述 了 跨越 时 间 和 空间 的 行为 。 行 为 事物 包括 交互 (Interaction)、 状 态 机 (State Machine) 和 
活动 (Activity)。 各 种 行为 事物 的 图 形 化 表示 如 图 7-3 所 示 。 


消息 状态 动作 
图 7-3 行为 事务 的 图 形 表示 
交互 由 在 特定 语 境 中 共同 完成 一 定 任务 的 一 组 对 象 之 间 交 换 的 消息 组 成 。 一 个 对 象 群体 的 
行为 或 单个 操作 的 行为 可 以 用 一 个 交互 来 描述 。 交 互 涉及 一 些 其 他 元 素 ， 包 括 消 息 、 动 作 序 列 


(由 一 个 消息 所 引起 的 行为 ) 和 链 (对 象 间 的 连接 )。 在 图 形 上 ， 把 一 个 消息 表示 为 一 条 有 向 直 
线 ， 通 常 在 表示 消息 的 线段 上 总 有 操作 名 。 
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状态 机 描述 了 一 个 对 象 或 一 个 交互 在 生命 期 内 响应 事件 所 经 历 的 状态 序列 。 单 个 类 或 一 组 
类 之 间 协 作 的 行为 可 以 用 状态 机 来 描述 。 一 个 状态 机 涉及 到 一 些 其 他 元 素 , 包括 状态 、 转 换 ( 从 
一 个 状态 到 另 一 个 状态 的 流 )、 事 件 〈 触 发 转换 的 事物 ) 和 活动 (对 一 个 转换 的 响应 )。 在 图 形 
上 ， 把 状态 表示 为 一 个 圆 角 和 矩形， 通常 在 圆 角 和 矩形 中 含有 状态 的 名 称 及 其 子 状态 。 

活动 是 描述 计算 机 过 程 执行 的 步骤 序列 , 注重 步骤 之 间 的 流 而 不 关心 哪个 对 象 执行 哪个 步 
了 又。 活动 的 一 个 步骤 称 为 一 个 动作 。 在 图 形 上 ， 把 动作 画 成 一 个 圆 角 和 矩形， 在 其 中 含有 指明 其 
用 途 的 名 字 。 状 态 和 动作 靠 不 同 的 语 境 得 以 区 别 。 

交互 、 状 态 机 和 活动 是 可 以 包含 在 UML 模型 中 的 基本 行为 事物 。 在 语义 上 ， 这 些 元 素 通 
党 与 各 种 结构 元 素 〈 主 要 是 类 、 协 作 和 对 象 ) 相关 。 

(3) 分 组 事物 (Grouping Thing)。 分 组 事物 是 UML 模型 的 组 织 部 分 ， 是 一 些 由 模型 分 解 
成 的 “盒子 ”。 在 所 有 的 分 组 事物 中 ， 最 主要 的 分 组 事物 是 包 (Package)。 包 是 把 元 素 组 织 成 组 
的 机 制 ， 这 种 机 制 具有 多 种 用 途 。 结 构 事物 、 行 为 事物 甚至 其 他 分 组 事物 都 可 以 放 进 包 内 。 包 
与 构件 〈 仅 在 运行 时 存在 ) 不 同 ， 它 纯粹 是 概念 上 的 《〈 即 它 仅 在 开发 时 存在 )。 包 的 图 形 化 表 
示 如 图 7-4 所 示 。 

(4) 注释 事物 (Annotational Thing)。 注 释 事物 是 UML 模型 的 解释 部 分 。 这 些 注释 事物 用 
来 描述 、 说 明和 标注 模型 的 任何 元 素 。 注 解 (Note) 是 一 种 主要 的 注释 事物 。 注 解 是 一 个 依附 
于 一 个 元 素 或 者 一 组 元 素 之 上 ， 对 它 进行 约束 或 解释 的 简单 符号 。 注 解 的 图 形 化 表示 如 图 7-5 
所 示 。 


| 
图 7-4 包 图 7-5 注解 


7.2.2 关系 


UML 中 有 4 种 关系 : 依赖 、 关 联 、 泛 化 和 实现 。 

(1) 依赖 (Dependency)。 依 赖 是 两 个 事物 间 的 语义 关系 ， 其 中 一 个 事物 (独立 事物 ) 发 
生变 化 会 影响 另 一 个 事物 (依赖 事物 ) 的 语义 。 在 图 形 上 ， 把 一 个 依赖 夯 成 一 条 可 能 有 方向 的 
虚线 ， 如 图 7-6 所 示 。 

(2) 关联 (Association)。 关 联 是 一 种 结构 关系 ， 它 描述 了 一 组 链 ， 链 是 对 象 之 间 的 连接 。 
聚集 (Aggregation) 是 一 种 特殊 类 型 的 关联 ， 它 描述 了 整体 和 部 分 间 的 结构 关系 。 关 联 和 聚集 
的 图 形 化 表示 如 图 7-7 和 图 7-8 所 示 。 
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在 关联 上 可 以 标注 重复 度 (Multiplicity) 和 角色 (Role)。 

(3) 泛 化 (Generalization)。 泛 化 是 一 种 特殊 /一 般 关 系 ， 特 殊 元 素 〈( 子 元 素 ) 的 对 象 可 替 
代 一 般 元 素 〈 父 元 素 ) 的 对 象 。 用 这 种 方法 ， 子 元 素 共享 了 父 元 素 的 结构 和 行为 。 在 图 形 上 ， 
把 一 个 泛 化 关系 画 成 一 条 带 有 空心 箭头 的 实 线 ， 它 指向 父 元 素 ， 如 图 7-9 所 示 。 

(4) 实现 Realization)。 实 现 是 类 元 之 间 的 语义 关系 ， 其 中 一 个 类 元 指定 了 由 另 一 个 类 元 
保证 执行 的 契约 。 在 两 种 情况 下 会 使 用 实现 关系 : 一 种 是 在 接口 和 实现 它们 的 类 或 构件 之 间 ; 
另 一 种 是 在 用 例 和 实现 它们 的 协作 之 间 。 在 图 形 上 ， 把 一 个 实现 关系 画 成 一 条 带 有 空心 箭头 的 
虚线 ， 如 图 7-10 所 示 。 


> 一- > 
图 7-9 泛 化 图 7-10 实现 


这 4 种 关系 是 UML 模型 中 可 以 包含 的 基本 关系 事物 。 它 们 也 有 变 体 ， 例 如 ， 依 赖 的 变 体 
有 精 化 、 跟 踪 、 包 含 和 延伸 。 


7.2.3 “UML 中 的 图 


图 (Diagram) 是 一 组 元 素 的 图 形 表示 ， 大 多 数 情况 下 把 图 画 成 项 点 (代表 事物 ) 和 弧 〈 代 
表 关 系 ) 的 连通 图 。 为 了 对 系统 进行 可 视 化 ,可 以 从 不 同 的 角度 画图 ， 这 样 图 是 对 系统 的 投影 。 

UML 2.0 提供 了 13 种 图 ， 分 别 是 类 图 、 对 象 图 、 用 例 图 、 序 列 图 、 通 信 图 、 状 态 图 、 活 
动 图 、 构 件 图 、 组 合 结构 图 、 部 署 图 、 包 图 、 交 互 概览 图 和 计时 图 。 序 列 图 、 通 信 图 、 交 互 概 
览 图 和 计时 图 均 被 称 为 交互 图 。 


1. 类 图 


类 图 (Class Diagram) 展现 了 一 组 对 象 、 接 口 、 协 作 和 它们 之 间 的 关系 。 在 面向 对 象 系统 
的 建 模 中 所 建立 的 最 常见 的 图 就 是 类 图 。 类 图 给 出 系统 的 静态 设计 视图 。 包 含 主动 类 的 类 图 给 
出 了 系统 的 静态 进程 视图 。 

类 图 中 通常 包括 下 述 内 容 〈 如 图 7-11 所 示 )。 

(1) 类 。 

(2) 接口 。 

(3) 协作 。 


(4) 依赖 、 泛 化 和 关联 关系 。 
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类 Company 
r 聚集 
一 多 重度 
| 各 阐 1 有 
Department 关联 Office 
name:Name Sa address:String 
voice:Number 
角 Department 
member | 1..* 1| manager 
依赖 
Person Headquarters 
属 name:Name 
性 employeeID:Integer 下 
| a PersonRecord 接口 
操作 getPersonalRecords() SS Wed 
作 一 一 一 
getPhoto(p:Photo) texID:Integer ( ) 
salary:Real 


图 7-11 UML 类 图 


类 图 中 也 可 以 包含 注解 和 约束 。 类 图 还 可 以 含有 包 或 子 系统 ， 二 者 都 用 于 把 模型 元 素 聚 集 


成 更 大 的 组 块 。 


类 图 用 于 对 系统 的 静态 设计 视图 建 模 。 这 种 视图 主要 支持 系统 的 功能 需求 ， 即 系统 要 提供 
给 最 终 用 户 的 服务 。 当 对 系统 的 静态 设计 视图 建 模 时 ， 通 常 以 下 述 3 种 方式 之 一 使 用 类 图 。 

(1) 对 系统 的 词汇 建 模 。 对 系统 的 词汇 建 模 涉 及 做 出 这 样 的 决定 : 哪些 抽象 是 考虑 中 的 系 
统 的 一 部 分 ， 哪 些 抽象 处 于 系统 边界 之 外 。 用 类 图 详细 描述 这 些 抽象 和 它们 的 职责 。 

(2) 对 简单 的 协作 建 模 。 协 作 是 一 些 共同 工作 的 类 、 接 口 和 其 他 元 素 的 群体 ， 该 群体 提供 
的 一 些 合作 行为 强 于 所 有 这 些 元 素 的 行为 之 和 。 例 如 ， 当 对 分 布 式 系统 的 事务 语义 建 模 时 ， 不 
能 仅仅 盯 着 一 个 单独 的 类 来 推断 要 发 生 什 么 ， 而 要 有 相互 协作 的 一 组 类 来 实现 这 些 语义 。 用 类 
图 对 这 组 类 以 及 它们 之 间 的 关系 进行 可 视 化 和 详 述 。 


(3) 对 逻辑 数据 库 模 式 建 模 。 将 模式 看 作为 数据 库 的 概念 设计 的 蓝图 。 在 很 多 领域 中 ， 


要 


在 关系 数据 库 或 面向 对 象 数据 库 中 存储 永久 信息 ， 可 以 用 类 图 对 这 些 数据 库 的 模式 建 模 。 


on 
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2. 对 象 图 


对 象 图 (Object Diagram) 展现 了 某 一 时 刻 一 组 对 象 以 及 它们 之 间 的 关系 ， 描 述 了 在 类 图 
中 所 建立 的 事物 的 实例 的 静态 快照 。 对 象 图 一 般 包 括 对 象 和 链 ， 如 图 7-12 所 示 。 


图 7-12 UML 对 象 图 


和 类 图 一 样 ， 对 象 图 给 出 系统 的 静态 设计 视图 或 静态 进程 视图 ， 但 它们 是 从 真实 的 或 原型 
实例 的 角度 建立 的 。 这 种 视图 主要 支持 系统 的 功能 需求 ， 即 系统 应 该 提供 给 最 终 用 户 的 服务 。 
利用 对 象 图 可 以 对 静态 数据 结构 建 模 。 

在 对 系统 的 静态 设计 视图 或 静态 进程 视图 建 模 时 ， 主 要 是 使 用 对 象 图 对 对 象 结构 进行 建 
模 。 对 象 结构 建 模 涉 及 在 给 定时 刻 抓 取 系统 中 对 象 的 快照 。 对 象 图 表示 了 交互 图 表示 的 动态 场 
景 的 一 个 静态 画面 ， 可 以 使 用 对 象 图 可 视 化 、 详 述 、 构 造 和 文档 化 系统 中 存在 的 实例 以 及 它们 
之 间 的 相互 关系 。 


3. 用 例 图 


用 例 图 (Use Case Diagram) 展现 了 一 组 用 例 、 参 与 者 〈Actor) 以 及 它们 之 间 的 关系 。 

用 例 图 通常 包括 以 下 内 容 〈 如 图 7-13 所 示 )。 

(1) 用 例 。 

(2) 参与 者 。 

(3) 用 例 之 间 的 扩展 关系 〈<<extend>>) 和 包含 关系 (<<include>>)， 参 与 者 和 用 例 之 间 
的 关联 关系 ， 用 例 与 用 例 以 及 参与 者 与 参与 者 之 间 的 泛 化 关系 。 
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Enroll System 包含 关系 
O 
Enroll Student in University |-------e<---s Enroll in Seminar 


<<include>> 


International Student 


图 7-13 ”UML 用例 图 


用 例 图 用 于 对 系统 的 静态 用 例 视图 进行 建 模 。 这 个 视图 主要 支持 系统 的 行为 ， 即 该 系统 在 
它 的 周边 环境 的 语 境 中 所 提供 的 外 部 可 见 服务 。 

当 对 系统 的 静态 用 例 视图 建 模 时 ， 可 以 用 下 列 两 种 方式 来 使 用 用 例 图 。 

(1) 对 系统 的 语 境 建 模 。 对 一 个 系统 的 语 境 进行 建 模 ， 包 括 围绕 整个 系统 画 一 条 线 ， 并 声 
明 有 哪些 参与 者 位 于 系统 之 外 并 与 系统 进行 交互 。 在 这 里 ， 用 例 图 说 明了 参与 者 以 及 它们 所 扮 
演 的 角色 的 含义 。 

(2) 对 系统 的 需求 建 模 。 对 一 个 系统 的 需求 进行 建 模 ， 包 括 说 明 这 个 系统 应 该 做 什么 〈 从 系 
统 外 部 的 一 个 视点 出 发 )， 而 不 考虑 系统 应 该 怎样 做 。 在 这 里 ， 用 例 图 说 明了 系统 想 要 的 行为 。 通 
过 这 种 方式 ， 用 例 图 使 我 们 能 够 把 整个 系统 看 作 一 个 黑 盒 子 ， 采 用 和 矩形 框 表示 系统 边界 ， 可 以 观 
察 到 系统 外 部 有 什么 ， 系 统 怎样 与 哪些 外 部 事物 相互 作用 ， 但 却 看 不 到 系统 内 部 是 如 何 工作 的 。 


4. 交互 图 


交互 图 用 于 对 系统 的 动态 方面 进行 建 模 。 交互 图 表现 的 是 一 个 交互 ， 由 一 组 对 象 和 它 
们 之 间 的 关系 组 成 ， 包 含 它们 之 间 可 能 ee 交互 图 表现 为 序列 图 、 通 信 图 、 交 互 概览 
图 和 计时 图 ， 每 种 针对 不 同 的 目的 ， 能 适用 于 不 同 的 情况 。 序 列 图 是 强调 消息 时 间 顺 序 的 交互 
图 ; 通信 图 是 强调 接收 和 发 送 消息 的 对 象 的 结构 组 织 的 交互 图 ; 交互 概览 图 强调 控制 流 的 交互 图 。 
交互 图 用 于 对 一 个 系统 的 动态 方面 建 模 。 在 多 数 情 况 下 ， 它 包括 对 类 、 接 口 、 构 件 和 结 点 
的 具体 的 或 原型 化 的 实例 以 及 它们 之 间 传 递 的 消息 进行 建 模 ， 所 有 这 些 都 位 于 一 个 表达 行为 的 
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脚本 的 语 境 中 。 交 互 图 可 以 单独 使 用 ， 来 可 视 化 、 详 述 、 构 造 和 文档 化 一 个 特定 的 对 象 群体 的 
动态 方面 ， 也 可 以 用 来 对 一 个 用 例 的 特定 的 控制 流 进行 建 模 。 

交互 图 一 般 包含 对 象 、 链 和 消息 。 

1) 序列 图 

序列 图 (Sequence Diagram) 是 场景 (Scenario) 的 图 形 化 表示 ， 描 述 了 以 时 间 顺 序 组 织 的 
对 象 之 间 的 交互 活动 。 如 图 7-14 所 示 ， 形 成 序列 图 时 ， 首 先 把 参加 交互 的 对 象 放 在 图 的 上 方 ， 
沿 水 平方 向 排列 。 通 常 把 发 起 交互 的 对 象 放 在 左边 ， 下 级 对 象 依次 放 在 右边 。 然 后 ， 把 这 些 对 
象 发 送 和 接收 的 消息 沿 垂直 方向 按时 间 顺 序 从 上 到 下 放置 。 这 样 ， 就 提供 了 控制 流 随 时 间 推移 
的 清晰 的 可 视 化 轨迹 。 


对 象 

PO 
! | 
<<create >> 1 
| 
1 
1 1 
1 
1 
1 


调用 消息 setAction (a,d,0) 


setValues (3,4) 


返回 消息 Ci We 
长 一 一 一 =@- 一 一 一 
destroy 1 1 ”异步 消息 
1 
对 象 生命 线 一 下 
1 对 象 销毁 


图 7-14 UML 序列 图 


序列 图 有 两 个 不 同 于 通信 图 的 特征 。 

(1) 序列 图 有 对 象 生命 线 。 对 象 生命 线 是 一 条 垂直 的 虚线 ， 表 示 一 个 对 象 在 一 段 时 间 内 存 
在 。 在 交互 图 中 出 现 的 大 多 数 对 象 存在 于 整个 交互 过 程 中 , 所 以 这 些 对 象 全 都 排列 在 图 的 项 部， 
其 生命 线 从 图 的 项 部 画 到 图 的 底部 。 但 对 象 也 可 以 在 交互 过 程 中 创建 ， 它 们 的 生命 线 从 接收 到 
构造 型 为 create 的 消息 时 开始 。 对 象 也 可 以 在 交互 过 程 中 撤销 ， 它 们 的 生命 线 在 接收 到 构造 型 
为 destroy 的 消息 时 结束 (并 且 给 出 一 个 大 于 的 标记 表明 生命 的 结束 )。 

(2) 序列 图 有 控制 焦点 。 控 制 焦点 是 一 个 瘦 高 的 矩形 ， 表 示 一 个 对 象 执行 一 个 动作 所 经 历 
的 时 间 段 ， 既 可 以 是 直接 执行 ， 也 可 以 是 通过 下 级 过 程 执 行 。 矩 形 的 顶部 表示 动作 的 开始 ， 底 
部 表示 动作 的 结束 (可 以 由 一 个 返回 消息 来 标记 )。 还 可 以 通过 将 另 一 个 控制 焦点 放 在 它 的 父 
控制 焦点 的 右边 来 显示 (由 循环 、 自 身 操作 调用 或 从 另 一 个 对 象 的 回调 所 引起 的 ) 控制 焦点 的 
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嵌 套 (其 风 套 深度 可 以 任意 )。 如 果 想 特别 精确 地 表示 控制 焦点 在 哪里 ， 也 可 以 在 对 象 的 方法 
被 实际 执行 〈 并 且 控 制 还 没 传 给 另 一 个 对 象 ) 期 间 将 那 段 矩 形 区 域 阴 影 

2) 通信 图 

通信 图 (Communication Diagram) 强调 收发 消息 的 对 象 的 结构 组 织 ,在 早期 的 版 本 中 也 被 
称 作 协作 图 。 通 信 图 强调 参加 交互 的 对 象 的 组 织 。 产 生 一 张 通信 图 ， 如 图 7-15 所 示 ， 首 先 要 将 
参加 交互 的 对 象 作为 图 的 项 点 ， 然 后 把 连接 这 些 对 象 的 链表 示 为 图 的 弧 ， 最 后 用 对 和 象 发 送 和 接 
收 的 消息 来 修饰 这 些 链 。 这 就 提供 了 在 协作 对 象 的 结构 组 织 的 语 境 中 观察 控制 流 的 一 个 清晰 的 
可 视 化 轨迹 。 


1:create () 
链 2:setActions (a,d,0) 消息 
3:destroy () 


2.1:setValues (d,3.4) 
序号 一 一 一 2.2:message 


图 7-15 UML 通信 图 


通信 图 有 两 个 不 同 于 序列 图 的 特性 。 

(1) 通信 图 有 路 径 。 为 了 指出 一 个 对 象 如 何 与 另 一 个 对 象 链接 ， 可 以 在 链 的 末端 附 上 一 个 
路 径 构 造型 (如 构造 型 《local》， 表示 指定 对 象 对 发 送 者 而 言 是 局 部 的 )。 通 常 只 需要 显 式 地 表 
示 以 下 几 种 链 的 路 径 : local (局 部 )、parameter (参数 )、global (全 局 ) 以 及 self (自身 ), 但 
不 必 表 示 association (关联 )。 

(2) 通信 图 有 顺序 号 。 为 表示 一 个 消息 的 时 间 顺 序 ， 可 以 给 消息 加 一 个 数字 前 级 (从 1 号 
消息 开始 )， 在 控制 流 中 ， 每 个 新 消息 的 顺序 号 单调 增加 (如 2、3 等 )。 为 了 显示 和 嵌 套 ， 可 使 
用 带 小 数 点 的 号 码 (1 表示 第 一 个 消息 ;1.1 表示 嵌 套 在 消息 1 中 的 第 一 个 消息 ，1.2 表示 嵌 套 
在 消息 1 中 的 第 二 个 消息 ， 等 等 )。 嵌 套 可 为 任意 深度 。 还 要 注意 的 是 ， 沿 同一 个 链 可 以 显示 许 
多 消息 (可 能 发 自 不 同 的 方向 )， 并 且 每 个 消息 都 有 唯一 的 一 个 顺序 号 。 

序列 图 和 通信 图 是 同 构 的 ， 它 们 之 间 可 以 相互 转换 。 

3) 交互 概览 图 

交互 概览 图 (Interaction Overview Diagram) 是 UML 2.0 新 增 的 交互 图 之 一 ， 它 是 活动 图 
的 变 体 , 描述 业务 过 程 中 的 控制 流 概览 , 软件 过 程 中 的 详细 逻辑 概览 ,以 及 将 多 个 图 进行 连接 ， 
抽象 掉 了 消息 和 生命 线 。 它 使 用 活动 图 的 表示 法 ， 如 图 7-16 所 示 。 纯粹 的 交互 概览 图 中 所 有 的 
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活动 都 是 交互 发 生 。 


sd Enroll in Seminar lifelines student: Student seminar: Seminar ] 


ref 
student.selectSeminar() 


ref [Ineligible] 
| EE 
[Eligible] 
o seat 
[et J rinar getermineSeatAvailabilityO) ] 
[Seat available] 
人 


ref 个 
[ol ED 


seminar.addToWaitingList(student) 


图 7-16 交互 概览 图 


4) 计时 图 

计时 图 (Timing Diagram) 是 另 一 种 新 增 的 、 特 别 适合 实时 和 柑 入 式 系统 建 模 的 交互 图 ， 
关注 沿 着 线性 时 间 轴 、 生 命 线 内 部 和 生命 线 之 间 的 条 件 改 变 。 它 描述 对 象 状 态 随 着 时 间 改 变 的 
情况 ， 很 像 示 波 器 ， 如 图 7-17 所 示 ， 适 合 分 析 周 期 和 非 周期 性 任务 。 


Cloud 


Watercycle 
Air 


Lake 


一 


图 7-17 UML 计时 图 (离散 时 序 ) 


状态 图 (State Diagram) 展现 了 一 个 状态 机 ， 它 由 状态 、 转 换 、 事 件 和 活动 组 成 。 状 态 图 
关注 系统 的 动态 视图 ， 对 于 接口 、 类 和 协作 的 行为 建 模 尤为 重要 ， 强 调 对 象 行为 的 事件 顺序 。 
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状态 图 通常 包括 简单 状态 和 组 合 状态 、 转 换 (事件 和 动作 )， 如 图 7-18 所 示 。 状 态 是 指 对 
象 的 生命 周期 中 某 个 条 件 或 者 状态 ， 在 此 期 间 对 象 将 满足 某 些 条 件 、 执 行 某 些 活动 或 等 待 某 些 
事件 ， 是 对 象 执行 了 一 系列 活动 的 结果 ， 当 某 个 事件 发 生 后 ， 对 象 的 状态 将 发 生变 化 。 嵌 套 在 
另外 一 个 状态 中 的 状态 称 为 子 状态 ， 含 有 子 状 态 的 状态 称 为 组 合 状态 。 转 换 是 两 个 状态 之 间 的 
一 种 关系 ， 表 示 对 象 将 在 源 状态 中 执行 一 定 的 动作 ， 并 在 某 个 特定 事件 发 生 而 且 某 个 特定 的 警 
界 〈 监 护 ) 条 件 满足 时 进入 目标 状态 。 动 作 是 一 个 可 执行 的 原子 操作 ， 是 不 可 中 断 的 ， 其 执行 
时 间 是 可 忽略 不 计 的 。 直 接 通过 进入 节点 进入 状态 ， 通 过 退出 节点 可 以 结束 状态 。 使 用 历史 状 
态 记 住 从 组 合 状态 中 退出 时 所 处 的 子 状态 ， 作 用 是 当 再 次 进入 组 合 状态 时 ， 可 以 直接 进入 这 个 
子 状态 ， 而 不 是 再 次 从 组 合 状态 的 初 态 开始 。 状 态 图 可 以 分 为 区 域 ， 而 区 域 又 包括 退出 或 者 当 
前 执行 的 子 状态 ， 说 明 组 合 状态 可 以 在 某 一 时 刻 同时 到 达 多 个 子 状态 ， 此 时 通常 在 其 前 后 使 用 
fork 和 join 标识 。 


ringing 


Transmiting 


CheckSum 


Cleaning Up 


六 事件 


可 以 用 状态 图 对 系统 的 动态 方面 建 模 。 这 些 动态 方面 可 以 包括 出 现在 系统 体系 结构 的 任何 
视图 中 的 任何 一 种 对 象 的 按 事件 排序 的 行为 ， 这 些 对 象 包括 类 〈 各 主动 类 )、 接 口 、 构 件 和 结 点 。 

当 对 系统 、 类 或 用 例 的 动态 方面 建 模 时 ， 通 常 是 对 反应 型 对 象 建 模 。 

一 个 反应 型 或 事件 驱动 的 对 象 是 这 样 一 个 对 象 ， 其 行为 通常 是 由 对 来 自 语 境外 部 的 事件 做 
出 反应 来 刻画 的 。 反 应 型 对 象 在 接收 到 一 个 事件 之 前 通常 处 于 空闲 状态 。 当 它 接收 到 一 个 事件 
时 ， 它 的 反应 常常 依赖 于 以 前 的 事件 。 在 这 个 对 象 对 事件 做 出 反应 后 ， 它 就 又 变 成 闲 状态 ， 等 
待 下 一 个 事件 。 对 于 这 种 对 象 ， 将 着 眼 于 对 象 的 稳定 状态 、 能 够 触发 从 状态 到 状态 的 转换 的 事 
件 ， 以 及 当 每 个 状态 改变 时 所 发 生 的 动作 。 


图 7-18 ”UML 状态 图 
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6. 活动 图 

活动 图 (Activity Diagram) 是 一 种 特殊 的 状态 图 ， 它 展现 了 在 系统 内 从 一 个 活动 到 另 一 个 
活动 的 流程 , 如 图 7-19 所 示 。 活动 图 专注 于 系统 的 动态 视图 , 它 对 于 系统 的 功能 建 模 特别 重要 ， 
并 强调 对 象 间 的 控制 流程 。 


开始 


Receive Order 


动作 


Receive Payment 


监护 表达 式 


并 发 汇合 


结束 


图 7-19 UML 活动 图 


活动 图 一 般 包 括 活动 状态 和 动作 状态 、 转 换 和 对 象 。 

用 活动 图 建 模 的 控制 流 中 ,会 发 生 一 些 事情 。 可 能 要 对 一 个 设置 属性 值 或 返回 一 些 值 的 表 
达 式 求 值 ， 也 可 能 要 调用 对 象 上 的 操作 ， 发 送 一 个 消息 给 对 象 ， 甚 至 创建 或 销毁 对 象 ， 这 些 可 
执行 的 原子 计算 被 称 作 动作 状态 ， 因 为 它们 是 该 系统 的 状态 ， 每 个 原子 计算 都 代表 一 个 动作 的 
执行 。 动 作 状 态 不 能 被 分 解 。 动 作 状 态 是 原子 的 ， 也 就 是 说 事件 可 以 发 生 ， 但 动作 状态 的 工作 
不 能 被 中 断 。 最 后 ， 动 作 状 态 的 工作 所 占用 的 执行 时 间 一 般 被 看 作 是 可 忽略 的 。 
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活动 状态 能 够 进一步 被 分 解 ， 它 们 的 活动 由 其 他 的 活动 图 表示 。 活 动 状态 不 是 原子 的 ， 它 
们 可 以 被 中 断 。 并 且 ， 一 般 来 说 ， 还 要 考虑 到 它 需 要 花费 一 段 时 间 来 完成 。 可 以 把 一 个 动作 状 
态 看 作 一 个 活动 状态 的 特例 。 类 似 地 ， 可 以 把 一 个 活动 状态 看 作 一 个 组 合 ， 它 的 控制 流 由 其 他 
的 活动 状态 和 动作 状态 组 成 。 

活动 图 可 以 表示 分 支 、 合 并 、 分 岔 和 汇合 。 分 支 描述 基于 布尔 表达 式 的 可 选择 路 径 ， 可 有 
一 个 入 流 和 两 个 或 多 个 出 流 ， 在 每 个 出 流 上 放置 一 个 布尔 表达 式 条 件 ， 每 个 出 流 的 条 件 不 应 该 
重 谷 ， 但 需要 覆盖 所 有 可 能 性 。 合 并 描述 当 两 条 控制 路 径 重 新 合并 时 ， 不 需要 监护 条 件 ， 只 有 
一 个 出 流 。 分 岔 描述 把 一 个 控制 流 分 成 两 个 或 多 个 并 发 控制 流 ， 可 以 有 一 个 进入 转移 和 两 个 或 
多 个 离 去 转移 ， 每 个 离 去 的 转移 表示 一 个 独立 的 控制 流 ， 这 些 流 可 以 并 行 的 进行 。 汇 合 表示 两 
个 或 多 个 并 发 控制 流 的 同步 ， 可 以 有 两 个 或 多 个 进入 转移 和 一 个 离 去 转移 ， 意 味 着 每 个 进入 流 
都 等 待 ， 直 到 所 有 进入 流 都 达到 这 个 汇合 处 。 

当 对 一 个 系统 的 动态 方面 建 模 时 ， 通 常 有 两 种 使 用 活动 图 的 方式 。 

(1) 对 工作 流 建 模 。 此 时 所 关注 的 是 与 系统 进行 协作 的 参与 者 所 观察 到 的 活动 。 工 作 流 常 
常 位 于 软件 系统 的 边缘 ， 用 于 可 视 化 、 详 述 、 构 造 和 文档 化 开发 系统 所 涉及 的 业务 过 程 。 在 活 
动 图 的 这 种 用 法 中 ， 对 对 象 流 的 建 模 是 特别 重要 的 ， 常 采用 泳 道 将 活动 图 中 的 活动 状态 分 组 。 

(2) 对 操作 建 模 。 此 时 是 把 活动 图 作为 流程 图 使 用 ， 对 一 个 计算 的 细节 部 分 建 模 。 在 活动 
图 的 这 种 用 法 中 ， 对 分 支 、 合 并 、 分 岔 和 汇合 状态 的 建 模 是 特别 重要 的 。 用 于 这 种 方式 的 活动 
图 语 境 包括 该 操作 的 参数 和 它 的 局 部 对 象 。 


7. 构件 图 


构件 图 (Component Diagram) 展现 了 一 组 构件 之 间 的 组 织 和 依赖 。 构 件 图 专注 于 系统 的 
静态 实现 视图 , 如 图 7-20 所 示 。 它 与 类 图 相关 , 通常 把 构件 映射 为 一 个 或 多 个 类 、 接口 或 协作 。 


《componenty 供 接口 
Order System 一 二 一 依 下 
ee 
CustomerLookup~— 、 «componenty 


i Customer 

Repository 
分 一 “CustomerLookup 
ProductAccessor 天 1 


需 接口 


1 
<componenty 构件 
nventory Syste, 


图 7-20 UML 构件 图 
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8. 组 合 结构 图 


组 合 结构 图 (Composite Structure Diagram) 用 于 描述 一 个 分 类 器 〈 如 类 、 构 件 或 用 例 ) 的 
内 部 结构 ， 分 类 器 与 系统 中 其 他 组 成 部 分 之 间 的 交互 端口 ， 展 示 一 组 相互 协作 的 实例 如 何 完成 
特定 的 任务 ， 描 述 设计 、 架 构 横 式 或 策略 。 组 合 结构 图 的 内 部 结构 和 协作 使 用 图 分 别 如 图 7-21 


和 图 7-22 所 示 。 
Bank ATM 
intemnal structure 
scd:Displal 
人 mdm:Modem [ 5 
external:Bus 
:Function Keys | 
:Bus 
crCard Reader Ee Fee 
:Encrypting 
PIN Pad mem:Bus 
:Memory 
Ey vltbus:Bus 
| :per 上 | 
二 二 1 
vault 
dispensing Mechanism disposit Mechanism :Security 
Sensor[1..*] 
! :Cash Cartridge[1.4] 1 :Deposit Cartridse[1.21 ee 
a ] 和 1 Journal 
图 7-21 内 部 结构 组 合 结构 图 
Le Observer Pattern ss 
et Ek 
~ 
了 D 、 
2 subject: 和 
pA (interface) Subject pn 
/ observers:Observer[* et ly 
1 Sie oT] | Jinterface) Observer | 
lstate:State = 
1 attach(Obserber) notify0 / 
\ detach(Obserber) / 
\ notifyAllO) / 
\ / 
、、 
AS Pd “ 


图 7-22 协作 使 用 组 合 结构 图 
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9. 部 署 图 


部 署 图 (Deployment Diagram) 是 用 来 对 面向 对 和 象 系统 的 物理 方面 建 模 的 方法 ， 展 现 了 运 
行 时 处 理 结 点 以 及 其 中 构件 (制品 ) 的 配置 。 部 署 图 对 系统 的 静态 部 署 视图 进行 建 模 ， 它 与 构件 图 
相关 。 通 常 ， 一 个 结 点 是 一 个 在 运行 时 存在 并 代表 一 项 计算 资源 的 物理 元 素 ， 至 少 拥有 一 些 内 容 ， 
常常 具有 处 理 能 力 ， 包 含 一 个 或 多 个 构件 。 部 署 图 如 图 7-23 所 示 ， 其 中 ，<<artifact>> 表 示 制 品 。 


:DB Server 


«artifactyD 


Web Server 


eartifacty DS 
Website 


artifacty 
HTML5 


图 7-23 UML 部 署 图 


10. 包 图 


包 图 (Package Diagram) 是 用 于 把 模型 本 身 组 织 成 层次 结构 的 通用 机 制 ， 不 能 执行 ， 展 现 
由 模型 本 身分 解 而 成 的 组 织 单元 以 及 其 间 的 依赖 关系 。 

包 可 以 拥有 其 他 元 素 ， 可 以 是 类 、 接 口 、 构 件 、 结 点 、 协 作 、 用 例 和 图 ， 甚 至 是 嵌 套 的 其 
他 包 ， 如 图 7-24 所 示 。 拥 有 是 一 种 组 成 关系 ， 是 一 种 按 规模 来 处 理 问 题 的 重要 机 制 ， 也 意味 着 
元 素 被 声明 在 包 中 ， 一 个 元 素 只 能 被 一 个 包 所 拥有 ， 拥 有 关系 的 包 形成 了 一 个 命名 空间 ， 其 中 
同一 种 元 素 的 名 称 必须 唯一 。 
F 一 二 


BusinessA 


] 
| Accounting || 。」 Bank 
TT | ordering n 


T | ri 
1 全 Shipping \ 
| + 1 、 
t yt 
包 八 je 
1 DaaMgmt 


] vy x 
UserDB EBusinessDB 


图 7-24 UML 包 图 
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7.3 设计 模式 


7.3.1 设计 模式 的 要 素 


“每 一 个 模式 描述 了 一 个 在 我 们 周围 不 断 重复 发 生 的 问题 ， 以 及 该 问题 的 解决 方案 的 核心 。 
这 样 ， 你 就 能 一 次 又 一 次 地 使 用 该 方案 而 不 必 做 重复 劳动 >。 设 计 模 式 的 核心 在 于 提供 了 相关 
问题 的 解决 方案 ， 使 得 人 们 可 以 更 加 简单 方便 地 复 用 成 功 的 设计 和 体系 结构 。 

设计 模式 一 般 有 以 下 4 个 基本 要 素 。 

(1) 模式 名 称 (Pattem Name)。 一 个 助 记名 ， 它 用 一 两 个 词 来 描述 模式 的 问题 、 解 决 方案 
和 效果 。 命 名 一 个 新 的 模式 增加 了 设计 词汇 。 设 计 模式 允许 在 较 高 的 抽象 层次 上 进行 设计 。 
基于 一 个 模式 词汇 表 ， 就 可 以 讨论 模式 并 在 编写 文档 时 使 用 它们 。 模 式 名 可 以 帮助 人 们 思考 ， 
便于 人 们 与 其 他 人 交流 设计 思想 及 设计 结果 。 找 到 恰当 的 模式 名 也 是 设计 模式 工作 的 难点 
= 

(2) 问题 (Problem)。 问 题 描述 了 应 该 在 何 时 使 用 模式 。 它 解释 了 设计 问题 和 问题 存在 的 
前 因 后 果 ， 可 能 描述 了 特定 的 设计 问题 ， 如 怎样 用 对 象 表示 算法 等 ， 也 可 能 描述 了 导致 不 灵活 
设计 的 类 或 对 象 结构 。 有 时 候 ， 问 题 部 分 会 包括 使 用 模式 必须 满足 的 一 系列 先决 条 件 。 

(3) 解决 方案 (Solution)。 解 决 方案 描述 了 设计 的 组 成 成 分 、 它 们 之 间 的 相互 关系 及 各 自 
的 职责 和 协作 方式 。 因 为 模式 就 像 一 个 模板 ， 可 应 用 于 多 种 不 同 场合 。 所 以 解决 方案 并 不 描述 
一 个 特定 的 具体 的 设计 或 实现 ， 而 是 提供 设计 问题 的 抽象 描述 和 怎样 用 一 个 具有 一 般 意义 的 元 
素 组 合 〈 类 或 对 象 组 合 ) 来 解决 这 个 问题 。 

(4) 效果 〈Consequences)。 效 果 描 述 了 模式 应 用 的 效果 及 使 用 模式 应 权衡 的 问题 。 尽 管 描 
述 设计 决策 时 ， 并 不 总 提 到 模式 效果 ， 但 它们 对 于 评价 设计 选择 和 理解 使 用 模式 的 代价 及 好 处 
具有 重要 意义 。 软 件 效 果 大 多 关注 对 时 间 和 空间 的 衡量 ， 它 们 也 表述 了 语言 和 实现 问题 。 因 为 
复 用 是 面向 对 象 设计 的 要 素 之 一 ， 所 以 横 式 效果 包括 它 对 系统 的 灵活 性 、 扩 充 性 或 可 移植 性 的 
影响 ， 显 式 地 列 出 这 些 效果 对 理解 和 评价 这 些 模式 很 有 帮助 。 

设计 横 式 确定 了 所 包含 的 类 和 实例 ， 它 们 的 角色 、 协 作 方式 以 及 职责 分 配 。 每 一 个 设计 模 
式 都 集中 于 一 个 特定 的 面向 对 象 设 计 问题 或 设计 要 点 ， 描 述 了 什么 时 候 使 用 它 ， 在 另 一 些 设计 
约束 条 件 下 是 否 还 能 使 用 , 以 及 使 用 的 效果 和 如 何 取 舍 。 按照 设计 模式 的 目的 可 以 分 为 三 大 类 ， 
如 表 7-1 所 示 。 

创建 型 模式 与 对 象 的 创建 有 关 ; 结构 型 模式 处 理 类 或 对 象 的 组 合 ; 行为 型 模式 对 类 或 对 象 
怎样 交互 和 怎样 分 配 职责 进行 描述 。 
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表 7-1 设计 模式 分 类 


创 建 型 行 为 型 
Jnt te 
类 Factory Method Adapter (类 ) erpreter 
Template Method 
Chain of Responsibility 
Adapter (对 象 ) Go 本 
Bui uma 
Abstract Factory dbe . Tterator 
i Composite Mediator 
Builder 
对 象 Decorator Wma 
Prototype 
， Facade Obevever 
Singleton 
Flyweight State 
Proxy Strategy 
Visitor 


7.3.2 ”创建 型 设计 模式 


创建 型 模式 抽象 了 实例 化 过 程 ， 它 们 帮助 一 个 系统 独立 于 如 何 创建 、 组 合 和 表示 它 的 那些 
对 象 。 一 个 类 创建 型 模式 使 用 继承 改变 被 实例 化 的 类 ， 而 一 个 对 象 创建 型 模式 将 实例 化 委托 给 
另 一 个 对 象 。 

随 着 系统 演化 得 越 来 越 依赖 于 对 象 复合 而 不 是 类 继承 ， 创 建 型 模式 变 得 更 为 重要 。 当 这 种 
情况 发 生 时 ， 重 心 从 对 一 组 固定 行为 的 硬 编码 (Hard-coding) 转移 为 定义 一 个 较 小 的 基本 行为 
集 ， 这 些 行 为 可 以 被 组 合成 任意 数目 的 更 复杂 的 行为 。 这 样 创建 有 特定 行为 的 对 象 要 求 的 不 仅 
仅 是 实例 化 一 个 类 。 

在 这 些 模式 中 有 两 个 不 断 出 现 的 主旋律 。 

第 一 ， 它 们 都 将 关于 该 系统 使 用 哪些 具体 的 类 的 信息 封装 起 来 。 

第 二 ， 它 们 隐藏 了 这 些 类 的 实例 是 如 何 被 创建 和 放 在 一 起 的 。 整 个 系统 关于 这 些 对 象 所 知 
道 的 是 由 抽象 类 所 定义 的 接口 。 

因此 ， 创 建 型 模式 在 什么 被 创建 ， 谁 创建 它 ， 它 是 怎样 被 创建 的 ， 以 及 何 时 创建 这 些 方面 
给 予 了 很 大 的 灵活 性 。 它 们 允许 用 结构 和 功能 差别 很 大 的 “产品 ”对 象 配置 一 个 系统 。 配 置 可 
以 是 静态 的 ( 即 在 编译 时 指定 )， 也 可 以 是 动态 的 (在 运行 时 )。 


1. Abstract Factory (抽象 工厂 ) 


1) 意图 
提供 一 个 创建 一 系列 相关 或 相互 依赖 对 象 的 接口 ， 而 无 须 指 定 它们 具体 的 类 。 
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2) 结构 

抽象 工厂 模式 的 结构 如 图 7-25 所 示 。 
AbstractFactory | 一 Client 
CreaterProductA() 
CreaterProductB() AbstractProductA 


全 一 LpProductA2 ProductAl [1 
1 1 
1 | 
ConcreteFactoryl 上 -， ConcreteFactory2 | ____ 1 | 
CreateProductA() 1 CreateProductA() ly 8 
CreateProductB() : CreateProductB() | AbstractProductB | 一 T 
1 1 
人 

1 1 
1 1 
! 上 一 | ProductB2 ProductB1 | 一-: 
1 1 
人 


图 7-25 抽象 工厂 模式 结构 图 


其 中 : 

。 ”AbstractFactory 声明 一 个 创建 抽象 产品 对 象 的 操作 接口 。 

。 ”ConcreteFactory 实现 创建 具体 产品 对 象 的 操作 。 

。 AbstractProduct 为 一 类 产品 对 象 声 明 一 个 接口 。 

e ”ConcreteProduct 定义 一 个 将 被 相应 的 具体 工厂 创建 的 产品 对 象 ， 实 现 AbstractProduct 


接口 。 
。 ”Client 仅 使 用 由 AbstractFactory 和 AbstractProduct 类 声明 的 接口 。 
3) 适用 性 


Abstract Factory 模式 适用 于 : 

。 一 个 系统 要 独立 于 它 的 产品 的 创建 、 组 合 和 表示 时 。 

。 一 个 系统 要 由 多 个 产品 系列 中 的 一 个 来 配置 时 。 

。 ” 当 要 强调 一 系列 相关 的 产品 对 象 的 设计 以 使 进行 联合 使 用 时 。 
。 ” 当 提 供 一 个 产品 类 库 ， 只 想 显 示 它 们 的 接口 而 不 是 实现 时 。 
2. Builder (生成 器 ) 


1) 意图 
将 一 个 复杂 对 象 的 构建 与 它 的 表示 分 离 ， 使 得 同样 的 构建 过 程 可 以 创建 不 同 的 表示 。 
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2) 结构 
生成 器 模式 的 结构 如 图 7-26 所 示 。 
Director builder Builder 
一 | 
Construct) OO BuildPart() 
T 
1 
1 
! A 
for all objects in structuref 
; builder->BuildPart() ConcrteBiildes | =a3 | Prodict 
BuildPart() 
GetResult() 


图 7-26 生成 器 模式 结构 图 


其 中 : 

。 Builder 为 创建 一 个 Product 对 象 的 各 个 部 件 指定 抽象 接口 。 

。 ”ConcreteBuilder 实现 Builder 的 接口 以 构造 和 装配 该 产品 的 各 个 部 件 , 定义 并 明确 它 所 
创建 的 表示 ， 提 供 一 个 检索 产品 的 接口 。 

。 ”Director 构造 一 个 使 用 Builder 接口 的 对 象 。 

。 ”Product 表示 被 构造 的 复杂 对 象 。ConcreteBuilder 创建 该 产品 的 内 部 表示 并 定义 它 的 装 
配 过 程 。 包 含 定义 组 成 组 件 的 类 ， 包 括 将 这 些 组 件 装配 成 最 终 产品 的 接口 。 

3) 适用 性 

Builder 模式 适用 于 : 

。 ” 当 创 建 复杂 对 象 的 算法 应 该 独立 于 该 对 象 的 组 成 部 分 以 及 它们 的 装配 方式 时 。 

。 ” 当 构 造 过 程 必须 允许 被 构造 的 对 象 有 不 同 的 表示 时 。 

3. Factory Method (工厂 方法 ) 


1) 意图 

定义 一 个 用 于 创建 对 象 的 接口 ， 让 子 类 决定 实例 化 哪 一 个 类 。Factory Method 使 一 个 类 的 
实例 化 延迟 到 其 子 类 。 

2) 结构 
工厂 方法 横 式 的 结构 如 图 7-27 所 示 。 
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AnOperation() O= 


| mouu | FactoryMethod() by 
product=FactoryMethod() 


八 


ConcreteProduct [一 -一 一 -一 
FactoryMethod() Os | return new ConcreteProduct 


图 7-27 工厂 方法 模式 结构 图 


其 中 : 

。 Product 定义 工厂 方法 所 创建 的 对 象 的 接口 。 

。 ”ConcreteProduct 实现 Product 接口 。 

e ”Creator 声明 工厂 方法 ， 该 方法 返回 一 个 Product 类 型 的 对 象 。Creator 也 可 以 定义 一 个 
工厂 方法 的 默认 实现 ， 它 返回 一 个 默认 的 ConcreteProduct 对 象 ， 可 以 调用 工厂 方法 以 
创建 一 个 Product 对 象 。 

ConcreteCreator 重 定 义工 厂 方法 以 返回 一 个 ConcreteProduct 实例 。 

3) 适用 性 

Factory Method 模式 适用 于 : 

。 ” 当 一 个 类 不 知道 它 所 必须 创建 的 对 象 的 类 的 时 候 。 

。 ” 当 一 个 类 希望 由 它 的 子 类 来 指定 它 所 创建 的 对 象 的 时 候 。 

。 ” 当 类 将 创建 对 象 的 职责 委托 给 多 个 帮助 子 类 中 的 某 一 个 ， 并 且 你 希望 将 哪 一 个 帮助 子 
类 是 代理 者 这 一 信息 局 部 化 的 时 候 。 


4. Prototype (原型 ) 


1) 意图 

用 原型 实例 指定 创建 对 象 的 种 类 ， 并 且 通 过 复制 这 些 原 型 创建 新 的 对 象 。 
2) 结构 

原型 模式 的 结构 如 图 7-28 所 示 。 

其 中 : 


。 ”Prototype 声明 一 个 复制 自身 的 接口 。 
。 ”ConcretePrototype 实现 一 个 复制 自身 的 操作 。 
。 ”Client 让 一 个 原型 复制 自身 从 而 创建 一 个 新 的 对 象 。 
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Client prototype 


Operation) 9 Clone() 
1 


p=prototype->Clone() 


ConcretePrototypel ConcretePrototype2 


Clone0 9 Clone0 9 


return copy of self S| return copy of self " 


图 7-28 原型 模式 结构 图 


3) 适用 性 

Prototype 模式 适用 于 : 

。 ” 当 一 个 系统 应 该 独立 于 它 的 产品 创建 、 构 成 和 表示 时 。 

。 ” 当 要 实例 化 的 类 是 在 运行 时 刻 指定 时 ， 例 如 ， 通 过 动态 装载 。 

。 为 了 避免 创建 一 个 与 产品 类 层次 平行 的 工厂 类 层次 时 。 

。 ” 当 一 个 类 的 实例 只 能 有 几 个 不 同 状态 组 合 中 的 一 种 时 。 建 立 相 应 数目 的 原型 并 克隆 它 
们 ， 可 能 比 每 次 用 合适 的 状态 手工 实例 化 该 类 更 方便 一 些 。 


S.， Singleton ( 单 例 ) 


1) 意图 
保证 一 个 类 仅 有 一 个 实例 ， 并 提供 一 个 访问 它 的 全 局 访问 点 。 
2) 结构 


单 例 模式 的 结构 如 图 7-29 所 示 。 


Singleton 


static Instance() ”CO- 才 ------- 一 | return uniquelnstance 
SingletonOperation() 
GetSingletonData() 


static uniquelnstance 
singletonData 


图 7-29 单 例 模式 结构 图 
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其 中 : Singleton 指定 一 个 Instance 操作 ， 人 允许 客户 访问 它 的 唯一 实例 ，Instance 是 一 个 类 
操作 ; 可 能 负责 创建 它 自己 的 唯一 实例 。 
3) 适用 性 
Singleton 模式 适用 于 : 
。 ” 当 类 只 能 有 一 个 实例 而 且 客 户 可 以 从 一 个 众所周知 的 访问 点 访问 它 时 。 
。 ” 当 这 个 唯一 实例 应 该 是 通过 子 类 化 可 扩展 的 ， 并 且 客 户 无 须 更 改 代 码 就 能 使 用 一 个 扩 
展 的 实例 时 。 


6. 创建 型 模式 比较 


用 于 系统 创建 的 那些 对 象 的 类 对 系统 进行 参数 化 有 两 种 常用 方法 : 生成 创建 对 象 的 类 的 子 
类 和 对 系统 进行 参数 化 的 方法 。 前 者 对 应 于 使 用 Factory Method 模式 ， 其 主要 缺点 是 仅 为 了 改 
变 产品 类 就 可 能 需要 创建 一 个 新 的 子 类 。 这 种 改变 可 能 级 联 发 生 ， 例 如 ， 如 果 产 品 的 创建 者 本 
身 是 一 个 工厂 方法 创建 的 ， 那 么 也 必须 重 定义 它 的 创建 者 。 后 者 更 多 地 依赖 于 对 象 的 复合 ， 定 
义 一 个 对 象 负责 明确 产品 对 象 的 类 ， 并 将 它 作为 该 系统 的 参数 。 这 是 Abstract Factory、Builder 
和 Prototype 模式 的 关键 特征 ， 都 涉及 创建 一 个 新 的 负责 创建 产品 对 象 的 “工厂 对 象 ”Abstract 
Factory 由 这 个 工厂 对 象 产生 多 个 对 象 。Builder 由 这 个 工厂 对 象 使 用 一 个 相对 复杂 的 协议 ， 逐 
步 创 建 一 个 复杂 产品 。Prototype 由 该 工厂 对 象 通过 复制 原型 对 象 来 创建 产品 对 象 。 在 这 种 情况 
下 ， 由 于 原型 负责 返回 产品 对 象 ， 所 以 工厂 对 象 和 原型 是 同一 个 对 象 。 


7.3.3 ”结构 型 设计 模式 


结构 型 设计 模式 涉及 如 何 组 合 类 和 对 象 以 获得 更 大 的 结构 。 结 构 型 类 模式 采用 继承 机 制 来 
组 合 接口 或 实现 。 一 个 简单 的 例子 是 采用 多 重 继承 方法 将 两 个 以 上 的 类 组 合成 一 个 类 ， 结 果 这 
个 类 包含 了 所 有 父 类 的 性 质 。 这 一 模式 尤其 有 助 于 多 个 独立 开发 的 类 库 协 同 工 作 。 其 中 一 个 例 
子 是 类 形式 的 Adapter 模式 。 一 般 来 说 ， 适 配器 使 得 一 个 接口 与 其 他 接口 兼容 ， 从 而 给 出 了 多 
个 不 同 接口 的 统一 抽象 。 为 此 ， 类 适配器 对 一 个 adaptee 类 进行 私有 继承 。 这 样 ， 适 配器 就 可 
以 用 adaptee 的 接口 表示 它 的 接口 。 

结构 型 对 象 模式 不 是 对 接口 和 实现 进行 组 合 ， 而 是 描述 了 如 何 对 一 些 对 象 进 行 组 合 ， 从 而 
实现 新 功能 的 一 些 方法 。 因 为 可 以 在 运行 时 刻 改变 对 象 组 合 关系 ， 所 以 对 象 组 合 方式 具有 更 大 
的 灵活 性 ， 而 这 种 机 制 用 静态 类 组 合 是 不 可 能 实现 的 。 

Composite 模式 是 结构 型 对 象 模式 的 一 个 实例 。 它 描述 了 如 何 构造 一 个 类 层次 式 结构 ， 这 

结构 由 两 种 类 型 的 对 象 所 对 应 的 类 构成 。 其 中 的 组 合 对 象 使 得 用 户 可 以 组 合 基 元 对 象 以 及 其 
他 的 组 合 对 象 ， 从 而 形成 任意 复杂 的 结构 。 在 Proxy 模式 中 ，proxy 对 象 作为 其 他 对 象 的 一 个 
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方便 的 替代 或 占 位 符 。 它 的 使 用 可 以 有 多 种 形式 ， 例 如 可 以 在 局 部 空间 中 代表 一 个 远程 地 址 空 
间 中 的 对 象 ， 也 可 以 表示 一 个 要 求 被 加 载 的 较 大 的 对 象 ， 还 可 以 用 来 保护 对 敏感 对 象 的 访问 。 
Proxy 模式 还 提供 了 对 对 象 的 一 些 特 有 性 质 的 一 定 程度 上 的 间接 访问 ， 从 而 可 以 限制 、 增 强 或 
修改 这 些 性 质 。Flyweight 模式 为 了 共享 对 象 定义 了 一 个 结构 。 至 少 有 两 个 原因 要 求 对 象 共享 ; 
效率 和 一 致 性 。Flyweight 的 对 象 共 享 机 制 主要 强调 对 象 的 空间 效率 。 使 用 很 多 对 象 的 应 用 必须 
考虑 每 一 个 对 象 的 开销 。 使 用 对 象 共享 而 不 是 进行 对 象 复制 ， 可 以 节省 大 量 的 空间 资源 。 但 是 ， 
仅 当 这 些 对 象 没有 定义 与 上 下 文 相关 的 状态 时 ， 它 们 才 可 以 被 共享 。Flyweight 的 对 象 没有 这 样 
的 状态 。 任 何 执行 任务 时 需要 的 其 他 一 些 信息 仅 当 需要 时 才 传 递 过 去 。 由 于 不 存在 与 上 下 文 相 
关 的 状态 ， 因 此 Flyweight 对 象 可 以 被 自由 地 共享 。 

如 果 说 Flyweight 模式 说 明了 如 何 生成 很 多 较 小 的 对 象 ， 那 么 Facade 模式 则 描述 了 如 何 用 
单个 对 象 表示 整个 子 系统 。 模 式 中 的 facade 用 来 表示 一 组 对 象 ，facade 的 职责 是 将 消息 转发 给 
它 所 表示 的 对 象 。Bridge 模式 将 对 象 的 抽象 和 其 实现 分 离 ， 从 而 可 以 独立 地 改变 它们 。 

Decorator 模式 描述 了 如 何 动态 地 为 对 象 添加 职责 。Decorator 模式 是 一 种 结构 型 模式 ， 这 
一 模式 采用 递归 方式 组 合 对 象 ， 从 而 允许 添加 任意 多 的 对 象 职责 。 例 如 ， 一 个 包含 用 户 界面 组 
件 的 Decorator 对 象 可 以 将 边框 或 阴影 这 样 的 装饰 添加 到 该 组 件 中 ， 或 者 它 可 以 将 窗口 滚动 和 
缩放 这 样 的 功能 添加 到 组 件 中 。 可 以 将 一 个 Decorator 对 象 颈 套 在 另外 一 个 对 象 中 ,就 可 以 很 简 
单 地 增加 两 个 装饰 ,添加 其 他 的 装饰 也 是 如 此 。 因 此 ,每 个 Decorator 对 象 必须 与 其 组 件 的 接口 
兼容 并 且 保证 将 消息 传递 给 它 。 Decorator 模式 在 转发 一 条 信息 之 前 或 之 后 都 可 以 完成 它 的 工作 
(例如 绘制 组 件 的 边框 )。 许 多 结构 型 模式 在 某 种 程度 上 具有 相关 性 。 


1. Adapter (适配器 ) 


1) 意图 

将 一 个 类 的 接口 转换 成 客户 希望 的 另外 一 个 接口 。Adapter 模式 使 得 原本 由 于 接口 不 兼容 
而 不 能 一 起 工作 的 那些 类 可 以 一 起 工作 。 

2) 结构 

类 适配器 使 用 多 重 继承 对 一 个 接口 与 另 一 个 接口 进行 匹配 ， 其 结构 如 图 7-30 所 示 。 对 象 
适配器 依赖 于 对 象 组 合 ， 其 结构 如 图 7-31 所 示 。 

其 中 : 

。 ”Target 定义 Client 使 用 的 与 特定 领域 相关 的 接口 。 

。 ”Client 与 符合 Target 接口 的 对 象 协同 。 

。 ”Adaptee 定义 一 个 已 经 存在 的 接口 ， 这 个 接口 需要 适 配 。 

。 ”Adapter 对 Adaptee 的 接口 与 Target 接口 进行 适 配 。 
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Adaptee 


SpecificReqestO) 


(implementation) 


Adapter 


Request() o-+-------— SpecificRequest() 


图 7-30 ”类 适配器 结构 图 


Client Target 
ReguestO) 
Client 广 -一 Target 
Request() 
Adapter 
Request() 
3) 适用 性 
Adapter 模式 适用 于 : 


adaptee 


| Adaptee 


SpecificRequest() 


人 


-一 -一 一 adaptee—>SpecificRequest() 


图 7-31 对 象 适配器 结构 图 


。 ” 想 使 用 一 个 已 经 存在 的 类 ， 而 它 的 接口 不 符合 要 求 。 

。 ” 想 创建 一 个 可 以 服用 的 类 ， 该 类 可 以 与 其 他 不 相关 的 类 或 不 可 预见 的 类 即 那 些 接口 
可 能 不 一 定 兼容 的 类 ) 协同 工作 。 

。 〈 仅 适用 于 对 象 Adapter) 想 使 用 一 个 已 经 存在 的 子 类 , 但 是 不 可 能 对 每 一 个 都 进行 子 
类 化 以 匹配 它们 的 接口 。 对 象 适配器 可 以 适 配 它 的 父 类 接口 。 


2. Bridge (桥接 ) 


1) 意图 


将 抽象 部 分 与 其 实现 部 分 分 离 ， 使 它们 都 可 以 独立 地 变化 。 


2) 结构 


桥接 模式 的 结构 如 图 7-32 所 示 。 
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Client 
imp 
一 全 | Abstraction =| Implementor 
Operation() © OperationImp() 
| imp->Operationlmp(); 有 
TT | 
ConcreteImplementorA ConcreteImplementorB 
RefinedAbstraction 
OperationImp() OperationImp() 
图 7-32 ”桥接 模式 结构 图 
其 中 了 


。 ”Abstraction 定义 抽象 类 的 接口 ， 维 护 一 个 指向 Implementor 类 型 对 象 的 指针 。 

。 ”RefinedAbstraction 扩充 由 Abstraction 定义 的 接口 。 

。 ”Implementor 定义 实现 类 的 接口 ， 该 接口 不 一 定 要 与 Abstraction 的 接口 完全 一 致 ， 事 
实 上 这 两 个 接口 可 以 完全 不 同 。 一 般 来 说 ，Implementor 接口 仅 提供 基本 操作 ， 而 
Abstraction 定义 了 基于 这 些 基 本 操作 的 较 高 层次 的 操作 。 

。 ”ConcreteImplementor 实现 Implementor 接口 并 定义 它 的 具体 实现 。 

3) 适用 性 

Bridge 模式 适用 于 : 

。 不 希望 在 抽象 和 它 的 实现 部 分 之 间 有 一 个 固定 的 绑 定 关系 。 例 如 ， 这 种 情况 可 能 是 因 
为 ， 在 程序 运行 时 刻 实现 部 分 应 可 以 被 选择 或 者 切换 。 

。 类 的 抽象 以 及 它 的 实现 都 应 该 可 以 通过 生成 子 类 的 方法 加 以 扩充 。 这 是 Bridge 模式 使 
得 开发 者 可 以 对 不 同 的 抽象 接口 和 实现 部 分 进行 组 合 ， 并 分 别 对 它们 进行 扩充 。 

。 ”对 一 个 抽象 的 实现 部 分 的 修改 应 对 客户 不 产生 影响 ， 即 客户 代码 不 必 重 新 编译 。 

。 “(C++) 想 对 客户 完全 隐藏 抽象 的 实现 部 分 。 

。 有 许多 类 要 生成 的 类 层次 结构 。 

。 ” 想 在 多 个 对 象 间 共享 实现 (可 能 使 用 引用 计数 )， 但 同时 要 求 客户 并 不 知道 这 一 点 。 


3. Composite (组 合 ) 
1) 意图 
将 对 象 组 合成 树 型 结构 以 表示 “部 分 -整体 ”的 层次 结构 。Composite 使 得 用 户 对 单个 对 象 
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和 组 合 对 象 的 使 用 具有 一 致 性 。 


2) 结构 


组 合 模式 的 结构 如 图 7-33 所 示 。 


Client (| » Component 一 
Operation() 
Add(Component) 
Remove(Component) 
GetChild(int) 
一 人 一 children 
Leaf Composite 
Operation() Operation() OO 
Add(Component) 
Remove(Component) 
GetChild(int) 
图 7-33 组合 模 式 结构 图 
其 中 : 


。 ”Component 为 组 合 中 的 对 象 声 明 接口 ; 在 适当 情况 下 实现 所 有 类 共有 接口 的 默认 行为 ; 
声明 一 个 接口 用 于 访问 和 管理 Component 的 子 组 件 ;( 可 选 ) 在 递归 结构 中 定义 一 个 


接口 ， 用 于 访问 一 个 父 组 件 ， 并 在 合适 的 情况 下 实现 它 。 


。 Leaf 在 组 合 中 表示 叶 结 点 对 象 ， 叶 结 点 没有 子 结 点 ; 在 组 合 中 定义 图 元 对 象 的 行为 。 

。 ”Composite 定义 有 子 组 件 的 那些 组 件 的 行为 ; 存储 子 组 件 ;， 在 Component 接口 中 实现 
与 子 组 件 有 关 的 操作 。 

。 Client 通过 Component 接口 操纵 组 合 组 件 的 对 象 。 

3) 适用 性 

Composite 模式 适用 于 : 


。 ” 想 表 示 对 象 的 部 分 -整体 层次 结构 。 


。 希望 用 户 忽略 组 合 对 象 与 单个 对 象 的 不 同 , 用 户 将 统一 地 使 用 组 合 结构 中 的 所 有 对 和 象 。 


ER forall g in children 
g.Operation(); 
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4. Decorator (装饰 ) 


1) 意图 
动态 地 给 一 个 对 象 添加 一 些 额外 的 职责 。 就 增加 功能 而 言 ， Decorator 模式 比 生成 子 类 更 加 


2) 结构 
装饰 模式 的 结构 如 图 7-34 所 示 。 
Component 1 
Operation() 
component 
ConcreteComponent Decorator 
. | 
Operation() Opuntial) Ghassan component->Operation() 
ConcreteDecoratorA | ConcreteDecoratorB 
oy Decorator::Operation(); S| 
Operation() Operation() O——- 一 J--- 一 一 - i 
Pp AddedBehavior0) AddedBehavior(); 
addedState 
图 7-34 ”装饰 器 模式 结构 图 
其 中 


。 ”Component 定义 一 个 对 象 接口 ， 可 以 给 这 些 对 象 动态 地 添加 职责 。 
。 ”ConcreteComponent 定义 一 个 对 象 ， 可 以 给 这 个 对 象 添加 一 些 职责 。 
。 Decorator 维持 一 个 指向 Component 对 象 的 指针 ， 并 定义 一 个 与 Component 接口 一 致 


的 接口 。 
。 ”ConcreteDecorator 向 组 件 添 加 职责 。 
3) 适用 性 


Decorator 模式 适用 于 : 

。 ”在 不 影响 其 他 对 象 的 情况 下 ， 以 动态 、 透 明 的 方式 给 单个 对 象 添加 职责 。 

。 ”处 理 那 些 可 以 撤销 的 职责 。 

。 ” 当 不 能 采用 生成 子 类 的 方式 进行 扩充 时 。 一 种 情况 是 ， 可 能 有 大 量 独 立 的 扩展 ， 为 支 
持 每 一 种 组 合 将 产生 大 量 的 子 类 ， 使 得 子 类 数目 呈 爆 炸 性 增长 。 另 一 种 情况 可 能 是 ， 
由 于 类 定义 被 隐藏 ， 或 类 定义 不 能 用 于 生成 子 类 。 


国 390 基 。 钦 作 设计 师 教程 (第 5 版 ) 


S. Facade〔 外 观 ) 


1) 意图 
为 子 系统 中 的 一 组 接口 提供 一 个 一 致 的 界面 ，Facade 模式 定义 了 一 个 高 层 接口 ， 这 个 接口 
使 得 这 一 子 系统 更 加 容易 使 用 。 


2) 


结构 


外 观 模式 的 结构 如 图 7-35 所 示 。 


subsysterm classes 


Tl | \ 


图 7-35 ”外观 模式 结构 图 


其 中 : 


Facade 知道 哪些 子 系统 类 负责 处 理 请 求 ， 将 客户 的 请 求 代理 给 适当 的 子 系统 对 象 。 
Subsystem classes 实现 子 系统 的 功能 ， 处理 有 Facade 对 象 指派 的 任务 ; 没有 Facade 的 
任何 相关 信息 ， 即 没有 指向 Facade 的 指针 。 


3) 适用 性 
Facade 模式 适用 于 : 


要 为 一 个 复杂 子 系统 提供 一 个 简单 接口 时 ， 子 系统 往往 因为 不 断 演化 而 变 得 越 来 越 复 
杂 。 大 多 数 模式 使 用 时 都 会 产生 更 多 更 小 的 类 ， 这 使 得 子 系统 更 具有 可 重用 性 ， 也 更 
容易 对 子 系统 进行 定制 , 但 也 给 那些 不 需要 定制 子 系统 的 用 户 带 来 一 些 使 用 上 的 困难 。 
Facade 可 以 提供 一 个 简单 的 默认 视图 ， 这 一 视图 对 大 多 数 用 户 来 说 已 经 足够 ， 而 那些 
需要 更 多 的 可 定制 性 的 用 户 可 以 越过 Facade 层 。 

客户 程序 与 抽象 类 的 实现 部 分 之 间 存 在 着 很 大 的 依赖 性 。 引入 Facade 将 这 个 子 系统 与 
客户 以 及 其 他 的 子 系统 分 离 ， 可 以 提高 子 系统 的 独立 性 和 可 移植 性 。 
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。 ” 当 需 要 构建 一 个 层次 结构 的 子 系统 时 ， 使 用 Facade 模式 定义 子 系统 中 每 层 的 入 口 点 。 
如 果子 系统 之 间 是 相互 依赖 的 ， 则 可 以 让 它们 仅 通 过 Facade 进行 通信 ， 从 而 简化 了 它 
们 之 间 的 依赖 关系 。 


6. Flyweight ( 享 元 ) 


1) 意图 
运用 共享 技术 有 效 地 支持 大 量 细 粒 度 的 对 象 。 
2) 结构 


享 元 模式 的 结构 如 图 7-36 所 示 。 


FlyweightFactory flyweights Flyweight 
GetFlyweight(key) © Operation(extrinsicState) 
T | 
if(flyweight[keyJexists){ 
return existing flyweight; 
}else{ 
create new flyweight; 
add it to poof of flyweights; 
retum the new flyweight; 
—w| ConcreteFlyweight —™| UnsharedConcreteFlyweight 
Operation(extrinsicState) Operation(extrinsicState) 
intrinsicState allState 
Client 
图 7-36 享 元 模式 结构 图 
其 中 : 


。 Flyweight 描述 一 个 接口 ， 通 过 这 个 接口 Flyweight 可 以 接受 并 作用 于 外 部 状态 。 

e ”ConcreteFlyweight 实现 Flyweight 接口 ， 并 为 内 部 状态 (如 果 有 ) 增加 存储 空间 。 
ConcreteFlyweight 对 象 必须 是 可 共享 的 。 它 所 存储 的 状态 必须 是 内 部 的 ， 即 它 必 须 独 
立 于 ConcreteFlyweight 对 象 的 场景 。 

。 并非 所 有 的 Flyweight 子 类 都 需要 被 共享 。 Flyweight 接口 使 共享 成 为 可 能 ， 但 它 并 不 
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Fs 


强制 共享 。 在 Flyweight 对 象 结构 的 某 些 层次 ，UnsharedConcreteFlyweight 对 象 通常 将 
ConcreteFlyweight 对 象 作 为 子 结 点 。 
FlyweightFactory 创建 并 管理 Flyweight 对 象 ; 确保 合理 地 共享 Flyweight， 当 用 户 请 求 
一 个 Flyweight 时 ，FlyweightFactory 对 象 提供 一 个 已 创建 的 实例 或 者 在 不 存在 时 创建 


一 个 实例 。 


Client 维持 一 个 对 Flyweight 的 引用 ; 计算 或 存储 一 个 或 多 个 Flyweight 的 外 部 状态 。 
3) 适用 性 

Flyweight 模式 适用 于 : 
一 个 应 用 程序 使 用 了 大 量 的 对 象 。 
完全 由 于 使 用 大 量 的 对 象 ， 造 成 很 大 的 存储 开销 。 
对 象 的 大 多 数 状态 都 可 变 为 外 部 状态 。 
如 果 删 除 对 象 的 外 部 状态 ， 那 么 可 以 用 相对 较 少 的 共享 对 象 取代 很 多 组 对 象 。 

应 用 程序 不 依赖 于 对 象 标识 。 由 于 Flyweight 对 象 可 以 被 共享 ， 所 以 对 于 概念 上 明显 
有 别 的 对 象 ， 标 识 测试 将 返回 真 值 。 


Proxy (代理 ) 


1) 意图 
为 其 他 对 象 提供 一 种 代理 以 控制 对 这 个 对 象 的 访问 。 
2) 结构 

代理 模式 的 结构 如 图 7-37 所 示 。 


其 中 : 


Client Subject 
Request() 
RealSubject realSubject Proxy 
Request() Request() O11 


图 7-37 代理 模式 结构 图 


realSubject->RequestO: 
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。 ”Proxy 保存 一 个 引用 使 得 代理 可 以 访问 实体 ;提供 一 个 与 Subject 的 接口 相同 的 接口 ， 
使 代理 可 以 用 来 代替 实体 ;控制 对 实体 的 存 取 ， 并 可 能 负责 创建 和 删除 它 ， 其 他 功能 
依赖 于 代理 的 类 型 : Remote Proxy 负责 对 请 求 及 其 参数 进行 编码 ， 并 向 不 同 地 址 空间 
中 的 实体 发 送 已 编码 的 请 求 ，Virtual Proxy 可 以 缓存 实体 的 附加 信息 ， 以 便 延 迟 对 它 
的 访问 ; Protection Proxy 检查 调用 者 是 否 具有 实现 一 个 请 求 所 必需 的 访问 权限 。 

。 ”Subject 定义 RealSubject 和 Proxy 的 共用 接口 ， 这 样 就 在 任何 使 用 RealSubject 的 地 方 
都 可 以 使 用 Proxy。 

。 ”RealSubject 定义 Proxy 所 代表 的 实体 。 

3) 适用 性 

Proxy 模式 适用 于 在 需要 比较 通用 和 复杂 的 对 象 指针 代替 简单 的 指针 的 时 候 , 常见 情况 有 : 

。 ”远程 代理 (Remote Proxy) 为 一 个 对 象 在 不 同 地 址 空间 提供 局 部 代表 。 

。 虚 代 理 〈Virtual Proxy) 根据 需要 创建 开销 很 大 的 对 象 。 

e ”保护 代理 〈Protection Proxy) 控制 对 原始 对 象 的 访问 ， 用 于 对 象 应 该 有 不 同 的 访问 权 
限 的 时 候 。 

。 智能 引用 〈Smart Reference) 取代 了 简单 的 指针 ， 它 在 访问 对 象 时 执行 一 些 附加 操作 。 
典型 用 途 包括 : 对 指向 实际 对 象 的 引用 计数 ， 这 样 当 该 对 象 没 有 引用 时 ， 可 以 被 自动 
释放 ; 当 第 一 次 引用 一 个 持久 对 象 时 ， 将 它 装 入 内 存 ， 在 访问 一 个 实际 对 象 前 ， 检 查 
是 否 已 经 锁定 了 它 ， 以 确保 其 他 对 象 不 能 改变 它 。 


8 结构 型 模式 比较 


Adapter 模式 和 Bridge 模式 具有 一 些 功能 特征 ， 都 给 另 一 个 对 象 提供 了 一 定 程度 上 的 间接 
性 , 因而 有 利于 系统 的 灵活 性 , 另外 都 涉及 从 自身 以 外 的 一 个 接口 向 这 个 对 象 转发 请 求 。 Adapter 
模式 主要 是 为 解决 两 个 已 有 接口 之 间 不 匹配 的 问题 ， 不 考虑 这 些 接口 是 怎样 实现 的 ， 也 不 考虑 
它们 各 自 可 能 会 如 何 演化 。 这 种 方式 不 需要 对 两 个 独立 设计 的 类 中 的 任何 一 个 进行 重新 设计 ， 
就 能 够 使 它们 协同 工作 。Bridge 模式 则 对 抽象 接口 与 它 的 〈 可 能 是 多 个 ) 实现 部 分 进行 桥接 。 
虽然 这 一 模式 运行 使 用 者 修改 实现 它 的 类 ， 但 是 它 仍然 为 用 户 提供 了 一 个 稳定 的 接口 ， 也 会 在 
系统 演化 时 适应 新 的 实现 。Adapter 模式 和 Bridge 模式 通常 被 用 于 软件 生命 周期 的 不 同 阶段 ， 
针对 不 同 的 问题 。Adapter 模式 在 类 已 经 设计 好 后 实施 ， 而 Bridge 模式 在 设计 类 之 前 实施 。 

Composite 模式 和 Decorator 模式 具有 类 似 的 结构 , 说 明 它 们 都 是 基于 递归 组 合 来 组 织 可 变 
数目 的 对 象 。Decorator 旨 在 能 够 不 需要 生成 子 类 即 可 给 对 象 添 加 职责 ， 这 避免 了 静态 实现 所 有 
功能 组 合 而 导致 子 类 急剧 增加 。Composite 旨 在 构造 类 , 使 多 个 相关 的 对 象 能 够 以 统一 的 方式 处 
理 ， 而 多 重 对 象 可 以 被 当 作 一 个 对 象 来 处 理 ， 重 点 在 于 表示 。 两 者 通常 协同 使 用 。 

Decorator 模式 和 Proxy 模式 都 描述 了 怎样 为 对 象 提供 一 定 程 度 上 的 间接 引用 。Proxy 模式 
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构成 一 个 对 象 并 为 用 户 提 供 一 致 的 接口 ， 与 Decorator 模式 不 同 的 是 ，Proxy 模式 不 能 动态 地 添 
加 或 分 离 性 质 , 也 不 是 为 递归 组 合 而 设计 的 , 它 强 调 一 种 关系 (Proxy 与 它 的 实体 之 间 的 关系 )， 
这 种 关系 可 以 静态 地 表达 。 其 目的 是 ， 当 直接 访问 一 个 实体 不 方便 或 不 符合 需要 时 ， 为 这 个 实 
体 提供 一 个 替代 者 , 例如 ,实体 在 远程 设备 上 , 访问 受到 限制 或 者 实体 是 持久 存储 的 。 在 Proxy 
模式 中 ， 实 体 定义 了 关键 功能 ， 而 Proxy 提供 或 拒绝 ) 对 它 的 访问 。 在 Decorator 模式 中 ， 组 
件 仅 提 供 了 部 分 功能 ， 而 一 个 或 多 个 Decorator 负责 完成 其 他 功能 。Decorator 模式 适用 于 编译 
时 不 能 (至 少 不 方 便 ) 确定 对 象 的 全 部 功能 的 情况 。 


7.3.4 行为 设计 模式 


行为 模式 涉及 算法 和 对 象 间 职 责 的 分 配 。 行 为 模式 不 仅 描述 对 象 或 类 的 模式 ， 还 描述 它们 
之 间 的 通信 模式 。 这 些 模 式 刻 画 了 在 运行 时 难以 跟踪 的 、 复 杂 的 控制 流 。 它 们 将 用 户 的 注意 力 
从 控制 流转 移 到 对 象 间 的 联系 方式 上 来 。 

行为 类 模式 使 用 继承 机 制 在 类 间 分 派 行为 。 本 小 节 包 括 两 个 这 样 的 模式 。 其 中 
Template Method 较为 简单 和 常用 。 模 板 方法 是 一 个 算法 的 抽象 定义 ， 它 逐步 地 定义 该 算法 ， 每 
一 步调 用 一 个 抽象 操作 或 一 个 原 语 操作 ， 子 类 定义 抽象 操作 以 具体 实现 该 算法 。 另 一 种 行为 类 
模式 是 Interpreter， 它 将 一 个 文法 表示 为 一 个 类 层次 ， 并 实现 一 个 解释 器 作为 这 些 类 的 实例 上 的 
一 个 操作 。 

行为 对 象 模式 使 用 对 象 复合 而 不 是 继承 。 一 些 行为 对 象 模式 描述 了 一 组 对 等 的 对 象 怎样 相 
互 协作 以 完成 其 中 任 一 个 对 象 都 无 法 单独 完成 的 任务 。 这 里 一 个 重要 的 问题 是 对 等 的 对 象 。 

如 何 互 相 了 解 对 方 。 对 等 对 象 可 以 保持 显 式 的 对 对 方 的 引用 ， 但 那 会 增加 它们 的 耦合 度 。 
在 极端 情况 下 , 每 一 个 对 象 都 要 了 解 所 有 其 他 的 对 象 。 Mediator 在 对 等 对 象 间 引入 一 个 mediator 
对 象 以 避免 这 种 情况 的 出 现 。mediator 提供 了 松 耦 合 所 需 的 间接 性 。 

Chain of Responsibility 提供 更 松 的 耦合 。 它 让 用 户 通过 一 条 候选 对 象 链 隐 式 地 向 一 个 对 象 
发 送 请 求 。 根 据 运行 时 刻 情况 任 一 候选 者 都 可 以 响应 相应 的 请 求 。 候 选 者 的 数目 是 任意 的 ， 可 
以 在 运行 时 刻 决定 哪些 候选 者 参与 到 链 中 。 

Observer 模式 定义 并 保持 对 象 间 的 依赖 关系 。 典 型 的 Observer 的 例子 是 Smalltalk 中 的 模 
型 /视图 /控制 器 ， 其 中 ， 一 旦 模型 的 状态 发 生变 化 ， 模 型 的 所 有 视图 都 会 得 到 通知 。 

其 他 的 行为 对 象 模式 常 将 行为 封装 在 一 个 对 象 中 并 将 请 求 指派 给 它 。Strategy 模式 将 算法 
封装 在 对 象 中 , 这 样 可 以 方便 地 指定 和 改变 一 个 对 和 象 所 使 用 的 算法 。 Command 模式 将 请 求 封 装 
在 对 象 中 ， 这 样 它 就 可 作为 参数 来 传递 ， 也 可 以 被 存储 在 历史 列表 中 ， 或 者 以 其 他 方式 使 
用 。State 模式 封装 一 个 对 象 的 状态 , 使 得 这 个 对 象 的 状态 对 象 变化 时 ,该 对 象 可 改变 它 的 行为 。 
Visitor 封装 分 布 于 多 个 类 之 间 的 行为 ， 而 Iterator 抽象 了 访问 和 遍历 一 个 集合 中 的 对 象 的 方式 。 
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1. Chain of Responsibility (责任 链 ) 


1) 意图 

使 多 个 对 象 都 有 机 会 处 理 请 求 ， 从 而 避免 请 求 的 发 送 者 和 接收 者 之 间 的 耦合 关系 。 将 这 些 
对 象 连 成 一 条 链 ， 并 沿 着 这 条 链 传递 该 请 求 ， 直 到 有 一 个 对 象 处 理 它 为 止 。 

2) 结构 

责任 链 模式 的 结构 图 如 图 7-38 所 示 。 


successor 


Client ~ Handler 


HandleRequest() 


人 


ConcreteHandlerl ConcreteHandler2 


HandleRequest() HandleRequest() 


图 7-38 责任 链 模 式 结构 图 


其 中 : 

。 Handler 定义 一 个 处 理 请 求 的 接口 ;〈 可 选 ) 实现 后 继 链 。 

。 ”ConcreteHandler 处 理 它 所 负责 的 请 求 ， 可 访问 它 的 后 继 者 ;如果 可 处 理 该 请 求 ， 就 处 
理 它 ， 否 则 将 该 请 求 转发 给 后 继 者 。 

。 ”Client 向 链 上 的 具体 处 理 者 (ConcreteHandler) 对 象 提 交 请 求 。 

3) 适用 性 

Chain of Responsibility 模式 适用 于 以 下 条 件 : 

。 ”有 多 个 的 对 象 可 以 处 理 一 个 请 求 ， 哪 个 对 象 处 理 该 请 求 运行 时 刻 自 动 确定 。 

。 ” 想 在 不 明确 指定 接收 者 的 情况 下 向 多 个 对 象 中 的 一 个 提交 一 个 请 求 。 

。 ”可 处 理 一 个 请 求 的 对 象 集合 应 被 动态 指定 。 


2. Command (命令 ) 


1) 意图 
将 一 个 请 求 封装 为 一 个 对 象 ， 从 而 使 得 可 以 用 不 同 的 请 求 对 客户 进行 参数 化 ， 对 请 求 排 队 
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或 记录 请 求 日 志 ， 以 及 支持 可 撤销 的 操作 。 


2) 


结构 


命令 模式 的 结构 图 如 图 7-39 所 示 。 


Client Invoker Command 


Action() | ConcreteCommand 


Execute() O---------—- receiver->Action(); 


state 


T Execute() 
1 

1 

| 

| Receiver 
1 

| 

1 

| 

| 

| 

| 


图 7-39 命令 模式 结构 图 


其 中 : 


Command 声明 执行 操作 的 接口 。 

ConcreteCommand 将 一 个 接收 者 对 象 绑 定 于 一 个 动作 ， 调 用 接收 者 相应 的 操作 ， 以 实 
现 Execute。 

Client 创建 一 个 具体 命令 对 象 并 设 定 它 的 接收 者 。 

Invoker 要 求 该 命令 执行 这 个 请 求 。 

Receiver 知道 如 何 实施 与 执行 一 个 请 求 相关 的 操作 。 任 何 类 都 可 能 作为 一 个 接收 者 。 


3) 适用 性 
Command 模式 适用 于 : 


抽象 出 待 执行 的 动作 以 参数 化 某 对 象 。Command 模式 是 过 程 语言 中 的 回调 (Callback) 
机 制 的 一 个 面向 对 象 的 替代 品 。 

在 不 同 的 时 刻 指定 、 排 列 和 执行 请 求 。 一 个 Command 对 象 可 以 有 一 个 与 初始 请 求 无 
关 的 生存 期 。 如 果 一 个 请 求 的 接收 者 可 用 一 种 与 地 址 空间 无 关 的 方式 表达 ， 那 么 就 可 
以 将 负责 该 请 求 的 命令 对 象 传递 给 另 一 个 不 同 的 进程 并 在 那儿 实现 该 请 求 。 

支持 取消 操作 。Command 的 Execute 操作 可 在 实施 操作 前 将 状态 存储 起 来 ， 在 取消 操 
作 时 这 个 状态 用 来 消除 该 操作 的 影响 。Command 接口 必须 添加 一 个 Unexecute 操作 ， 
该 操作 取消 上 一 次 Execute 调用 的 效果 。 执 行 的 命令 被 存储 在 一 个 历史 列表 中 。 可 通 
过 向 后 和 向 前 遍历 这 一 列表 并 分 别 调用 Unexecute 和 Execute 来 实现 重 数 不 限 的 “取消 ” 
和 “ 重 做 ”。 
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。 ”支持 修改 日 志 。 这 样 当 系统 崩溃 时 ， 这 些 修改 可 以 被 重 做 一 遍 。 在 Command 接口 中 
添加 装载 操作 和 存储 操作 ， 可 以 用 来 保持 变动 的 一 个 一 致 的 修改 日 志 。 从 崩溃 中 恢复 
的 过 程 包括 从 磁盘 中 重新 读 入 记录 下 来 的 命令 并 用 Execute 操作 重新 执行 它们 。 

。 用 构建 在 原 语 操作 上 的 高 层 操 作 构 造 一 个 系统 。 这 样 一 种 结构 在 支持 事务 
(Transaction) 的 信息 系统 中 很 常见 。Command 模式 提供 了 对 事务 进行 建 模 的 方法 。 
Command 有 一 个 公共 接口 , 使 得 可 以 用 同一 种 方式 调用 所 有 的 事务 , 同时 使 用 该 模式 
也 易于 添加 新 事务 以 扩展 系统 。 


3. JInterpreter (解释 器 ) 


1) 意图 

给 定 一 个 语言 ， 定 义 它 的 文法 的 一 种 表示 ， 并 定义 一 个 解释 器 ， 这 个 解释 器 使 用 该 表示 来 
解释 语言 中 的 句子 。 

2) 结构 

解释 器 模式 的 结构 图 如 图 7-40 所 示 。 


| 


Context 


人 一 一 一 一 AbstractExpression 


Interpret(Context) 


TerminalExpression NonterminalExpression 


Interpret(Context) Interpret(Context) 


图 7-40 解释 器 模式 结构 图 


其 中 
。 ”AbstractExpression 声明 一 个 程序 的 解释 操作 ， 这 个 接口 为 抽象 语法 树 中 所 有 的 结 点 所 


。 ”TerminalExpression 实现 与 文法 中 的 终结 符 相 关联 的 解释 操作 ; 一 个 句子 中 的 每 个 终结 
符 需要 该 类 的 一 个 实例 。 

。 ”NonterminalExpression 对 文法 中 的 每 一 条 规则 都 需要 一 个 NonterminalExpression 类 ; 
为 每 个 符号 都 维护 一 个 AbstractExpression 类 型 的 实例 变量 ; 为 文法 中 的 非 终结 符 实现 
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解释 (Interpret) 操作 。 


。 ”Context 包含 解释 器 之 外 的 一 些 全 局 信息 。 


。 Client 构建 (或 被 给 定 ) 表示 该 文法 定义 的 语言 中 一 个 特定 的 句子 的 抽象 语法 树 ， 该 
抽象 语法 树 由 NonterminalExpression 和 TerminalExpression 的 实例 装配 而 成 ， 调 用 解 


释 操作 。 
3) 适用 性 


Interpreter 模 式 适 用 于 当 有 一 个 语言 需要 解释 执行 ,并 且 可 将 该 语言 中 的 句子 表示 为 一 个 抽 


象 语法 树 时 ， 以 下 情况 效果 最 好 : 


。 ”该 文法 简单 。 对 于 复杂 的 发 文 ， 文 法 的 类 层次 变 得 庞大 而 无 法 管理 。 此 时 语法 分 析 程 
序 生成 器 这 样 的 工具 是 更 好 的 选择 。 它 们 无 须 构建 抽象 语法 树 即 可 解释 表达 式 ， 这 样 


可 以 节省 空间 还 可 能 节省 时 间 。 


。 ”效率 不 是 一 个 关键 问题 。 最 高 效 的 解释 器 通常 不 是 通过 直接 解释 语法 分 析 树 实现 的 ， 
而 是 首先 将 它们 转换 成 另 一 种 形式 。 不 过 ， 即 使 在 这 种 情况 下 ， 转 换 器 仍然 可 用 该 模 


4. Iterator (和 迭代 器 ) 


1) 意图 


提供 一 种 方法 顺序 访问 一 个 聚合 对 象 中 的 各 个 元 素 ， 且 不 需要 暴露 该 对 象 的 内 部 表示 。 


2) 结构 
迭代 器 模式 的 结构 图 如 图 7-41 所 示 。 


Aggregate Client Iterator 
Createlterator() First() 
Next() 
lsDone() 
Currentltern() 
ConcreteAggregate | 
Concretelterator 
Createlterator() © 
1 
| 
return new Concretelterator(this) 局 
图 7-41 过 代 器 模式 结构 图 


其 中 : 
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Iterator (从 代 器 ) 定义 访问 和 遍历 元 素 的 接口 。 


。 ”ConcreteIterator (具体 迭代 器 〉 实 现 迭 代 器 接口 ， 对 该 聚合 遍历 时 跟踪 当前 位 置 。 

。 ” Aggregate (聚合 ) 定义 创建 相应 迭代 器 对 象 的 接口 。 

。 ”ConcreteAggregate( 具 体 聚 合 ) 实 现 创 建 相应 迭代 器 的 接口 ,该 操作 返回 ConcreteIterator 
的 一 个 适当 的 实例 。 

3) 适用 性 

Iterator 模式 适用 于 : 


。 访问 一 个 聚合 对 象 的 内 容 而 无 须 暴露 它 的 内 部 表示 。 
。 支持 对 聚合 对 象 的 多 种 遍历 。 
。 ”为 遍历 不 同 的 聚合 结构 提供 一 个 统一 的 接口 。 


S，Mediator (中 介 者 ) 


1) 意图 

用 一 个 中 介 对 象 来 封装 一 系列 的 对 象 交 互 。 中 介 者 使 各 对 象 不 需要 显 式 地 相互 引用 ， 从 而 
使 其 耦合 松散 ， 而 且 可 以 独立 地 改变 它们 之 间 的 交互 。 

2) 结构 

中 介 者 模式 的 结构 图 如 图 7-42 所 示 。 


eT mediator Colleague 


ConcreteMediator [| ConcreteColleaguel 下 ConcreteColleague2 


图 7-42 ”中介 者 模式 结构 图 


其 中 : 

。 ”Mediator (中介 者 ) 定义 一 个 接口 用 于 各 同事 (Colleague) 对 象 通信 。 

。 ”ConcreteMediator (具体 中 介 者 ) 通过 协调 各 同事 对 象 实现 协作 行为 ， 了 解 并 维护 它 的 
各 个 同事 。 

。 ”Colleague class (同事 类 ) 知道 它 的 中 介 者 对 象 ; 每 一 个 同事 类 对 象 在 需要 与 其 他 同事 
通信 的 时 候 与 它 的 中 介 者 通信 。 

3) 适用 性 

Mediator 模式 适用 于 : 
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6. 


一 组 对 象 以 定义 良好 但 是 复杂 的 方式 进行 通信 ， 产 生 的 相互 依赖 关系 结构 混乱 且 难 以 
理解 。 

一 个 对 象 引 用 其 他 很 多 对 象 并 且 直 接 与 这 些 对 象 通信 ， 导 致 难以 复 用 该 对 象 。 

想 定制 一 个 分 布 在 多 个 类 中 的 行为 ， 而 又 不 想 生成 太 多 的 子 类 。 


Memento (备忘录 ) 


1) 意图 
在 不 破坏 封装 性 的 前 提 下 捕获 一 个 对 象 的 内 部 状态 ， 并 在 对 象 之 外 保存 这 个 状态 。 这 样 以 
后 就 可 以 将 对 象 恢复 到 原先 保存 的 状态 。 


2) 


结构 
此 模式 的 结构 图 如 图 7-43 所 示 。 
Orginator ~ Memento ieneto:| Caretaker 


SetMemento(Mementom) © GelState() 
CreateMemento0 © | SelState() 


state | state 


return new Memento(state) 轩 state=m—>GetState() 习 


图 7-43 备忘录 模式 结构 图 


其 中 : 


Memento 备忘录 ) 存储 原 发 器 对 象 的 内 部 状态 ， 原 发 器 根据 需要 决定 备忘录 存储 原 
发 器 的 哪些 内 部 状态 ， 防 止 原 发 器 以 外 的 其 他 对 象 访问 备忘录 。 

Originator 〈 原 发 器 ) 创建 一 个 备忘录 ， 用 于 记录 当前 时 刻 它 的 内 部 状态 ; 使 用 备忘录 
Caretaker 管理 者 ) 负责 保存 好 备忘录 ; 不 能 对 备忘录 的 内 容 进行 操作 或 检查 。 


3) 适用 性 
Memento 模式 适用 于 : 


必须 保存 一 个 对 象 在 某 一 个 时 刻 的 《部 分 ) 状态 ， 这 样 以 后 需要 时 它 才 能 恢复 到 先前 
的 状态 。 

如 果 一 个 用 接口 来 让 其 他 对 象 直接 得 到 这 些 状 态 ， 将 会 暴露 对 象 的 实现 细节 并 破坏 对 
象 的 封装 性 。 
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7. Observer (观察 者 ) 


1) 意图 
定义 对 象 间 的 一 种 一 对 多 的 依赖 关系 ， 当 一 个 对 象 的 状态 发 生 改 变 时 ， 所 有 依赖 于 它 的 对 
象 都 得 到 通知 并 被 自动 更 新 。 


2) 结构 

观察 者 模式 的 结构 图 如 图 7-44 所 示 。 
Subject observers Observer 
Attach(Observer) Update0) 
Detach(Observer) 


lfor all o in observers { 


NotifyO o----- E } o->Update() 
人 ConcreteObserver 


ConcreteSubject Update() 0- Sb wi i 的 
GetState() 0---[- . ~ observerState 
SetState() return subjectState 


subjectSate 


图 7-44 ”观察 者 模式 结构 图 

其 中 : 

。 Subject (目标) 知道 它 的 观察 者 ， 可 以 有 任意 多 个 观察 者 观察 同一 个 目标 ;提供 注册 
和 删除 观察 者 对 象 的 接口 。 

。 ”Observer (观察 者 ) 为 那些 在 目标 发 生 改变 时 需 获 得 通知 的 对 象 定义 一 个 更 新 接口 。 

。 ”ConcreteSubject (具体 目标 ) 将 有 关 状 态 存 入 各 ConcreteObserver 对 象 ; 当 它 的 状态 发 
生 改 变 时 ， 向 它 的 各 个 观察 者 发 出 通知 。 

。 ”ConcreteObserver (具体 观察 者 ) 维护 一 个 指向 ConcreteSubject 对 象 的 引用 ; 存储 有 关 
状态 ， 这 些 状态 应 与 目标 的 状态 保持 一 致 ， 实 现 Observer 的 更 新 接口 ， 以 使 自身 状态 
与 目标 的 状态 保持 一 致 。 

3) 适用 性 

Observer 模式 适用 于 : 

。 ” 当 一 个 抽象 模型 有 两 个 方面 ， 其 中 一 个 方面 依赖 于 另 一 个 方面 ， 将 这 两 者 封装 在 独立 
的 对 象 中 以 使 它们 可 以 各 自 独立 地 改变 和 复 用 。 

。 ” 当 对 一 个 对 象 的 改变 需要 同时 改变 其 他 对 象 ， 而 不 知道 具体 有 多 少 对 象 有 待 改 变 时 。 


。 ” 当 一 个 对 象 必须 通知 其 他 对 象 ， 而 它 又 不 能 假定 其 他 对 和 象 是 谁 ， 即 不 希望 这 些 对 象 是 
紧 耦 合 的 。 
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8. State (状态 ) 


1) 意图 
人 允许 一 个 对 象 在 其 内 部 状态 改变 时 改变 它 的 行为 。 对 象 看 起 来 似乎 修改 了 它 的 类 。 
2) 结构 
状态 模式 的 结构 图 如 图 7-45 所 示 。 
Context Se =| State 
Request() ? Handle() 
ee 
ConcreteStateA ConcreteStateB 
Handle0 Handle() 
图 7-45 ”状态 模式 结构 图 
其 中 了 


e Context (上 下 文 ) 定义 客户 感 兴趣 的 接口 ， 维 护 一 个 ConcreteState 子 类 的 实例 ， 这 个 
实例 定义 当前 状态 。 

。 State (状态 ) 定义 一 个 接口 以 封装 与 Context 的 一 个 特定 状态 相关 的 行为 。 

。 ”ConcreteState (具体 状态 子 类 ) 每 个 子 类 实现 与 Context 的 一 个 状态 相关 的 行为 。 

3) 适用 性 

State 模式 适用 于 : 

。 一 个 对 象 的 行为 决定 于 它 的 状态 ， 并 且 它 必须 在 运行 时 刻 根据 状态 改变 它 的 行为 。 

。 一 个 操作 中 含有 庞大 的 多 分 支 的 条 件 语 句 ， 且 这 些 分 支 依赖 于 该 对 象 的 状态 。 这 个 状 
态 常用 一 个 或 多 个 枚 举 常量 表示 。 通 常 ， 有 多 个 操作 包含 这 一 相同 的 条 件 结构 。State 
模式 将 每 一 个 条 件 分 支 放 入 一 个 独立 的 类 中 。 这 使 得 开发 者 可 以 根据 对 象 自身 的 情况 
将 对 象 的 状态 作为 一 个 对 象 ， 这 一 对 象 可 以 不 依赖 于 其 他 对 象 独立 变化 。 


9. Strategy〔 策 略 ) 


1) 意图 

定义 一 系列 的 算法 ， 把 它们 一 个 个 封装 起 来 ， 并 且 使 它们 可 以 相互 替换 。 此 模式 使 得 算法 
可 以 独立 于 使 用 它们 的 客户 而 变化 。 

2) 结构 

策略 模式 的 结构 图 如 图 7-46 所 示 。 
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Context ey Strategy 
ContextInterface() Algorithminterface() 
ConcreteStrategyA ConcreteStrategyB ConcreteStrategyC 
AlgorithmInterface() AlgorithmInterface() AlgorithmiInterface() 
图 7-46 策略 模式 结构 图 
其 中 : 


。 Strategy〈 策 略 ) 定义 所 有 支持 的 算法 的 公共 接口 。Context 使 用 这 个 接口 来 调用 某 
ConcreteStrategy 定义 的 算法 。 

。 ”ConcreteStrategy (具体 策略 ) 以 Strategy 接口 实现 某 具 体 算法 。 

。 Context (上 下 文 ) 用 一 个 ConcreteStrategy 对 象 来 配置 ; 维护 一 个 对 Strategy 对 象 的 引 
用 ; 可 定义 一 个 接口 来 让 Strategy 访问 它 的 数据 。 

3) 适用 性 

Strategy 模式 适用 于 : 

。 许多 相关 的 类 仅仅 是 行为 有 异 。“ 策 略 ” 提 供 了 一 种 用 多 个 行为 中 的 一 个 行为 来 配置 一 
个 类 的 方法 。 

。 ”需要 使 用 一 个 算法 的 不 同 变 体 ,例如 , 定义 一 些 反映 不 同 空间 的 空间 /时 间 权 衡 的 算法 。 
当 这 些 变 体 实现 为 一 个 算法 的 类 层次 时 ， 可 以 使 用 策略 模式 。 

。 算法 使 用 客户 不 应 该 知道 的 数据 。 可 使 用 策略 模式 以 避免 暴露 复杂 的 、 与 算法 相关 的 
数据 结构 。 

。 ”一 个 类 定义 了 多 种 行为 ,并且 这 些 行为 在 这 个 类 的 操作 中 以 多 个 条 件 语句 的 形式 出 现 ， 
将 相关 的 条 件 分 支 移入 它们 各 自 的 Strategy 类 中 ， 以 代替 这 些 条 件 语句 。 


10. Template Method (模板 方法 ) 


1) 意图 

定义 一 个 操作 中 的 算法 骨架 , 而 将 一 些 步骤 延迟 到 子 类 中 。Template Method 使 得 子 类 可 以 
不 改变 一 个 算法 的 结构 即 可 重 定义 该 算法 的 某 些 特定 步骤 。 

2) 结构 

模板 方法 模式 的 结构 图 如 图 7-47 所 示 。 
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AbstractClass 


TemplatcMcthod0 ” oO--f---- 一 ------- 
PrimitiveOperation1() Re | 
PrimitiveOperation2() PrimitiveOperation20 


PrimitiveOperation!() 


ConcreteClass 


PrimitiveOperation1() 
PrimitiveOperation2() 


图 7-47 ”模板 方法 模式 结构 图 


其 中 : 

。 ”AbstractClass (抽象 类 ) 定义 抽象 的 原 语 操作 ， 具 体 的 子 类 将 重 定义 它们 以 实现 一 个 
算法 的 各 步骤 ， 实 现 模板 方法 ， 定 一 个 算法 的 骨架 ， 该 模板 方法 不 仅 调用 原 语 操作 ， 
也 调用 定义 在 AbstractClass 或 其 他 对 象 中 的 操作 。 

。 ”ConcreteClass (具体 类 ) 实现 原 语 操作 以 完成 算法 中 与 特定 子 类 相关 的 步骤 。 

3) 适用 性 

Template Method 模式 适用 于 : 

。 一 次 性 实现 一 个 算法 的 不 变 的 部 分 ， 并 将 可 变 的 行为 留 给 子 类 来 实现 。 

。 ”各 子 类 中 公共 的 行为 应 被 提取 出 来 并 集中 到 一 个 公共 父 类 中 ， 以 避免 代码 重复 。 

。 ”控制 子 类 扩展 。 模 板 方法 则 在 特定 点 调用 “hook” 操 作 默 认 的 行为 ， 子 类 可 以 在 必 
要 时 进行 重 定义 扩展 )， 这 就 只 允许 在 这 些 点 进行 扩展 。 

11. Visitor (访问 者 ) 


1) 意图 
表示 一 个 作用 于 某 对 象 结构 中 的 各 元 素 的 操作 。 它 允许 在 不 改变 各 元 素 的 类 的 前 提 下 定义 
作用 于 这 些 元 素 的 新 操作 。 

2) 结构 

访问 者 模式 的 结构 图 如 图 7-48 所 示 。 

其 中 : 

e Visitor (访问 者 ) 为 该 对 象 结构 中 ConcreteElement 的 每 一 个 类 声明 一 个 Visit 操 
作 。 该 操作 的 名 字 和 特征 标识 了 发 送 Visit 请 求 给 该 访问 者 的 那个 类 ， 这 使 得 访问 者 
可 以 确定 正 被 访问 元 素 的 具体 的 类 。 这 样 访问 者 就 可 以 通过 该 元 素 的 特定 接口 直接 访 
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问 它 。 


Client “上 -一 一 Visitor 


VisitConcreteElementA(ConcreElementA) 
VisitConcreteElementB(ConcreElementB) 


人 


ConereteVisitorl ConcrcteVisitor2 
VisitConcreteElementA(ConcreElementA) VisitConcreteElementA(ConcreElementA) 
VisitConcrctcElcemcntB(ConcrcElcmcntB) VisitConcrctcElcmcntB(ConcrcElcmcntB) 


~ ObjectStructure 上 一 一 一 Element 


Accept( Visitor) 


ConcreteElementA ConcreteElementB 


Accept(Visitor vy) 9 Accept(Visitor vy) © 
OperationA() . OperationB() Ht 
一 上 


1 
v—>VisitConcreteElementA(th; S| | Vv VisitConcreteElementB(this) 


图 7-48 访问 者 模式 结构 图 


e ”ConcreteVisitor (具体 访问 者 ) 实现 每 个 有 Visitor 声明 的 操作 ， 每 个 操作 实现 本 算法 
的 一 部 分 ， 而 该 算法 片段 乃 是 对 应 于 结构 中 对 象 的 类 。ConcreteVisitor 为 该 算法 提供 
了 上 下 文 并 存储 它 的 局 部 状态 。 这 一 状态 常常 在 遍历 该 结构 的 过 程 中 累积 结果 。 

。 Element (元 素 ) 定义 以 一 个 访问 者 为 参数 的 Accept 操作 。 

e ”ConcreteElement (具体 元 素 ) 实现 以 一 个 访问 者 为 参数 的 Accept 操作 。 

。 ”ObjectStructure (对 象 结构 ) 能 枚 举 它 的 元 素 ; 可 以 提供 一 个 高 层 的 接口 以 允许 该 访问 
者 访问 它 的 元 素 ; 可 以 是 一 个 组 合 或 者 一 个 集合 ， 如 一 个 列表 或 一 个 无 序 集合 。 

3) 适用 性 

Visitor 模式 适用 于 : 

。 ”一 个 对 象 结构 包含 很 多 类 对 象 ， 它 们 有 不 同 的 接口 ， 而 用 户 想 对 这 些 对 象 实施 一 些 依 
赖 于 其 具体 类 的 操作 。 
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。 需要 对 一 个 对 象 结构 中 的 对 象 进行 很 多 不 同 的 并 且 不 相关 的 操作 ， 而 又 想 要 避免 这 些 
操作 “污染 ”这 些 对 象 的 类 。Visitor 使 得 用 户 可 以 将 相关 的 操作 集中 起 来 定义 在 一 个 
类 中 。 当 该 对 象 结构 被 很 多 应 用 共享 时 ， 用 Visitor 模式 让 每 个 应 用 仅 包含 需要 用 到 的 
操作 。 

。 ”定义 对 象 结构 的 类 很 少 改变 ， 但 经 常 需要 在 此 结构 上 定义 新 的 操作 。 改 变 对 象 结构 类 
需要 重 定 义 对 所 有 访问 者 的 接口 , 这 可 能 需要 很 大 的 代价 。 如果 对 象 结构 类 经 常 改变 ， 
那么 可 能 还 是 在 这 些 类 中 定义 这 些 操作 较 好 。 


12. 行为 模式 比较 


很 多 行为 模式 注重 封装 变化 。 当 一 个 程序 的 某 个 方面 的 特征 经 常 发 生 改变 时 ， 这 些 模 式 就 
定义 一 个 封装 这 个 方面 的 对 象 。 这 样 ， 当 该 程序 的 其 他 部 分 依赖 于 这 个 方面 时 ， 它 们 都 可 以 与 
此 对 象 协作 。 这 些 模式 通常 定义 一 个 抽象 类 来 描述 这 些 封装 变化 的 对 象 ， 并 且 通 常 该 模式 依据 
这 个 对 象 来 命名 。 例 如 : 

。 一 个 Strategy 对 象 封 装 一 个 算法 。 

。 一 个 State 对 象 封装 一 个 与 状态 相关 的 行为 。 

。 一 个 Mediator 对 象 封装 对 象 间 的 协议 。 

。 ”一 个 Iterator 对 象 封装 访问 和 遍历 一 个 聚集 对 象 中 的 各 个 组 件 的 方法 。 

这 些 模式 描述 了 程序 中 很 可 能 会 改变 的 方面 。 大 多 数 模式 有 两 种 对 象 : 封装 该 方面 特征 的 
新 对 象 和 使 用 这 些 新 对 象 的 已 有 对 象 。 但 并 非 所 有 的 对 象 行为 模式 都 有 这 样 的 分 割 功能 , 例如 ， 
Chain of Responsibility 可 以 处 理 任意 数目 的 对 象 〈 即 一 个 链 )， 而 所 有 这 些 对 象 可 能 已 经 存在 于 
系统 中 了 。 这 也 说 明了 行为 模式 的 另 一 个 不 同 点 : 并 非 所 有 的 行为 模式 都 定义 类 之 间 的 静态 通 
信 关 系 。 

一 些 模式 引入 总 是 被 用 作 参 数 的 对 象 。 例 如 Visitor, 一 个 Visitor 对 象 是 一 个 多 态 的 Accept 
操作 的 参数 ， 这 个 操作 作用 于 该 Visitor 对 象 访问 的 对 象 。 其 他 模式 定义 一 些 可 作为 令 牌 进行 
传递 的 对 象 ， 这 些 对 象 将 在 稍 后 被 调用 。 例 如 ，Command 和 Memento。 在 Command 中 ， 令 牌 
代表 一 个 请 求 : 在 Memento 中 ， 两 台 代 表 在 一 个 对 象 在 某 个 特定 时 刻 的 内 部 状态 。 在 这 两 种 
情况 下 ， 令 牌 都 可 以 有 一 个 复杂 的 内 部 表示 ， 但 客户 并 不 会 意识 到 这 一 点 。 另 外 ， 在 
Command 模式 中 多 态 特别 重要 ， 这 是 因为 执行 Command 对 象 是 一 个 多 态 操作 。 而 Memento 
接口 非常 小 ， 以 至 于 备忘录 只 能 作为 一 个 值 传递 ， 因 此 ， 它 很 可 能 根本 不 给 它 的 客户 提供 任何 
多 态 操作 。 

Mediator 和 Observer 是 相互 竞争 的 模式 ， 它 们 之 间 的 差别 是 ，Observer 通过 引入 Observer 
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和 Subject 对 象 来 分 布 通信 ， 而 Mediator 对 象 则 封装 了 其 他 对 象 间 的 通信 。Observer 模式 中 不 
存在 封装 一 个 约束 的 单个 对 象 ， 而 必须 是 Observer 和 Subject 对 象 相互 协作 来 维护 这 个 约束 。 
通信 模式 由 Observer 和 Subject 连接 的 方式 决定 : 一 个 Subject 通常 有 多 个 Observer， 并 且 有 时 
一 个 Subject 的 Observer 也 是 另 一 个 Observer 的 目标 。Observer 模式 有 利于 Observer 和 Subject 
之 间 的 分 割 和 松 耦 合 ， 易 于 产生 更 细 粒 度 且 更 易于 复 用 的 类 。Mediator 模式 的 目的 是 集中 而 不 
是 分 布 ， 它 将 维护 一 个 约束 的 职责 直接 放 在 一 个 中 间 者 中 。 

Command、Observer、Mediator 和 Chain of Responsibility 等 模式 都 涉及 如 何 对 发 送 者 和 接 
收 者 解 厢 ， 但 各 自 有 不 同 的 权衡 考虑 。 

Command 模式 使 用 一 个 Command 对 象 来 定义 一 个 发 送 者 和 一 个 接收 者 之 间 的 绑 定 关系 ， 
从 而 支持 解 厢 。Command 对 象 提供 了 一 个 提交 请 求 的 简单 接口 〈 即 Execute 操作 )， 将 发 送 者 
和 接收 者 之 间 的 连接 定义 在 一 个 对 象 ， 使 得 该 发 送 者 可 以 与 不 同 的 接收 者 一 起 工作 ， 达 到 将 发 
送 者 和 接收 者 解 厢 ， 使 发 送 者 更 易于 复 用 。 此 外 ， 可 以 复 用 Command 对 象 ， 用 不 同 的 发 送 者 
参数 化 一 个 接收 者 。 

Observer 模式 通过 定义 一 个 接口 来 通知 目标 中 发 生 的 改变 ， 从 而 将 发 送 者 (目标 ) 与 接收 
者 (观察 者 ) 解 厢 。Observer 定义 了 一 个 比 Command 更 松 的 发 送 者 -接收 者 绑 定 ， 这 是 因为 一 
个 目标 可 能 有 多 个 观察 者 ， 并 且 其 数目 可 以 在 运行 时 变化 。 此 模式 中 的 Subject 和 Observer 接 
口 是 为 了 处 理 Subject 的 变化 而 设计 的 ， 因 此 ， 当 对 象 间 有 数据 依赖 时 ， 最 好 用 此 模式 来 对 它 
们 进行 解 看 。 

Mediator 模式 让 对 象 通过 一 个 Mediator 对 象 间 接 相 互 引用 ， 从 而 对 它们 进行 解 厢 。 一 个 
Mediator 对 象 为 各 Colleague 对 象 间 的 请 求 提供 路 由 ， 并 集中 它们 的 通信 。 因 此 ， 各 Colleague 
对 象 仅 能 通过 Mediator 接口 相互 通信 。Mediator 接口 是 固定 的 ， 为 了 增加 灵活 性 ，Mediator 可 
能 不 得 不 实现 它 自 己 的 分 发 策略 。 可 以 用 一 定 方式 对 请 求 编码 并 打包 参数 ， 使 得 Colleague 对 
象 可 以 请 求 的 操作 数目 不 限 。 由 于 此 模式 将 通信 行为 集中 到 一 个 类 中 而 不 是 将 其 分 布 在 各 个 子 
类 中 ， 所 以 它 可 以 减少 一 个 系统 的 子 类 生成 。 

Chain of Responsibility 模式 通过 沿 一 个 潜在 接收 者 链 传递 请 求 而 将 发 送 者 与 接收 者 解 耦 。 
因为 发 送 者 和 接收 者 之 间 的 接口 是 固定 的 ， 责 任 链 可 能 也 需要 一 个 定制 的 分 发 策略 。 


7.3.5 ”应 用 举例 


【 例 7.7】 Visitor 模式 。 

某 图 书 管理 系统 中 管理 着 两 种 类 型 的 文献 : 图 书 和 论文 。 现 在 要 求 统计 所 有 馆藏 文献 的 总 
页 码 〈 假 设 图 书馆 中 有 一 本 540 页 的 图 书 和 两 篇 各 25 页 的 论文 ， 那 么 馆藏 文献 的 总 页 码 就 是 
590 页 )。 适 合 采用 Visitor 模式 实现 该 要 求 ， 设 计 图 如 图 7-49 所 示 。 
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图 7-49 ”馆藏 文献 统计 访问 者 模式 类 图 


C++ 程序 如 下 : 


class LibraryVisitor' 
class LibraryItemInterface { 
public: 
Virtual void accept(LibraryVisitor* visitor) = 0; 
}; 
class Article : public LibraryItemInterface { 
private: 
string m title; // 论 文 名 
string Im_author: /论文 作者 
int m start page; 
int m end page; 
public: 
Article(string p_author, string p_title, int p_start_ page,intp_end_page ): 
int getNumberOfPages(): 
void accept(LibraryVisitor* visitor); 
}; 


class Book : public LibraryItemInterface { 


Private: 
string m title; // 书 名 
string m author; /作者 
int m pages: // 页 数 
public: 
Book(string p_author, string p_title, int p_pages):; 
int getNumberOfPages(); 
Void accept(LibraryVisitor* visitor); 
}; 
class LibraryVisitor { 
public: 
Virtual void visit(Book* p_book) = 0; 
Virtual void visit(Article* p_article) = 0; 
Virtual void printSum() = 0; 
}; 


class LibrarySumPrintVisitor : public LibraryVisitor { /打印 总 页 数 
Private: 
int sum:; 
public: 
LibrarySumPrintVisitor(); 
void visit(Book* p_book); 
void visit(Article* p_article); 
void printSum(); 
}; 
// visitor.cpp 
int Article::getNumberOfPagesO{ 
return m end page - m start page; 
} 
void Article::accept(Library Visitor* visitor){ visitor->visit(this); } 
Book::Book(string p_author, string p_title, int p_pages ){ 
m title =p_title; 
m author = p_author; 


m pages =p_pages; 
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让 

int Book::getNumberOfPages|{ Teturmn m pages; } 

void Book::accept(LibraryVisitor* visitor){ visitor->visit(this); } 
// 其 余 代码 省 略 


Java 程序 如 下 : 


import java.util.*; 


interface LibraryVisitor { 
Void visit(Book p_book); 
void visit(Article p_article); 
void printSum(); 
} 
class LibrarySumPrintVisitor implements LibraryVisitor { /打印 总 页 数 
Private int sum = 0; 
public void visit(Book p_boolo{ 
sum = sum + p_book.getNumberOfPages(); 
} 
public void visit(Article p_article) { 
sum = sum + p_article.getNumberOfPages(); 


} 

public void printSumO{ 
System.out.println("SUM = " + sum); 

} 


} 
interface LibraryItemInterface { 
void accept(LibraryVisitor visitor):; 


} 

class Article implements LibraryItemInterface { 
Private String  m title; /论文 名 
private String  m author:; /论文 作者 


Private int m start page: 
Private int m end page; 

public Article(String p_author, String p_title, int p_start_ page,int p_end page ){ 
m title=p_title; 


m author = p_author:; 
m start page= p_start page: 
m end page=p_end page; 


} 
public int getNumberOfPagesO{ 
return m end page - m start page; 
; 
public void accept(LibraryVisitor visitor){ 
visitor.visit(this); 
} 
} 
class Book implements LibraryItemInterface { 
private String 。” m title; // 书 名 
private String 。” m author; // 书 作者 
private int m pages; // 页 数 


public Book(String p_author, String p_title, int p_pages ){ 
m title =p_title; 
m author = p_author; 
m pages =p_pages; 


} 
public int getNumberOfPages|O{ 


Teturn m _pages; 


} 
public void accept(LibraryVisitor visitor){ 


visitor.visit(this); 


【 例 7.8】 Observer 模式 。 


4 


一 大 型 购物 中 心 的 收银 软件 中 ， 要 求 其 能 够 支持 购物 中 心 在 不 同时 期 推出 的 各 种 促销 活 
动 , 如 打折 、 返 利 (例如 , 满 300 返 100) 等 等 ,针对 促销 活动 的 不 同 策略 , 适合 采用 策略 (Strategy) 


模式 实现 该 要 求 ， 得 到 如 图 7-50 所 示 的 类 图 。 
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图 7-50 ”购物 中 心 收银 软件 策略 模式 类 图 


C++ 程序 如 下 : 


#include <iostream> 
using namespace std; 


enum TYPE { NORMAL, CASH DISCOUNT CASH RETURN): 


class CashSuper { 


public: 
Virtual double acceptCash(double money) = 0; 
上 
class CashNormal : public CashSuper { /正常 收费 子 类 
public: 
double acceptCash(double money) { retum money: } 
}; 
class CashDiscount : public CashSuper { 
private: 
double moneyDiscount; /1/ 折 扣 率 
public: 
CashDiscount(double discount) { moneyDiscount = discount; } 
double acceptCash(double money) { return money * moneyDiscount: } 
3 
class CashReturn : public CashSuper { // 满 额 返利 
private: 


double moneyCondition; // 满 额 数 额 
double moneyRetum; // 返 利 数额 


public: 
CashReturn(double moneyCondition, double moneyReturn) { 
this->moneyCondition = moneyCondition; 
this->moneyReturn = moneyReturn; 
} 
double acceptCash(double money) { 
double result = money; 
if(money >= moneyCondition) 
result = money - (int)(money / moneyCondition ) * moneyReturn: 
return result: 
} 
上 


class CashContext { 
Private: 
CashSuper *cs; 
public: 
CashContext(int type) { 


switch(type) { 
case NORMAL: /正常 收费 


cs = new CashNormal(); 
break; 
case CASH_ RETURN: // 满 300 返 100 
cs = new CashReturn(300, 100); 
break; 
case CASH_DISCOUNT: ”// 打 8 折 
cs= new CashDiscount(0.8); 
break: 


} 
double GetResult(double money) { 
Tetum cs->acceptCash(money): 
3 
3 
/此 处 略 去 main0 函 数 


Java 程序 如 下 : 
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import java.util.*; 


enum TYPE {NORMAL,CASH DISCOUNT., CASH RETURN)}: 
interface CashSuper { 

public double acceptCash(double money); 
} 


class CashNormal implements CashSuper { // 正 常 收费 子 类 
public double acceptCash(double money) { 
return money; 


class CashDiscount implements CashSuper { 
Private double moneyDiscount:; // 折 扣 率 
public CashDiscount(double moneyDiscount) { 
this.moneyDiscount = moneyDiscount; 
} 
public double acceptCash(double money) { 
Tetur money * moneyDiscount:; 
} 
} 
class CashReturn implements CashSuper { // 满 额 返利 
Private double moneyCondition; 
private double moneyReturn; 
public CashReturn(double moneyCondition, double moneyReturn) { 
this.moneyCondition = moneyCondition:; // 满 额 数额 
this.moneyReturn = moneyRetum; // 返 利 数额 
} 
public double acceptCash(double money) { 
double result = money: 
if(money >= moneyCondition) 
result = money - Math.floor(money / moneyCondition ) * moneyReturn:; 
return result: 


class CashContext { 


} 


private CashSuper cs; 
private TYPE ft; 
public CashContext(TYPED { 
switch(t) { 
case NORMAL : 1" 正常 收费 " 
cs = new CashNormal(); 

break: 

case CASH_DISCOUNT: 1" 打 8 折 " 
cs= new CashDiscount(0.8): 
break: 

case CASH RETURN: /1m 满 300 返 100" 
cs= new CashReturn(300, 100); 
break:; 


} 
public double GetResult(double money) { 


Teturmn cs.acceptCash(money); 


} 
// 此 处 略 去 main0 方 法 
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算法 被 公认 为 是 计算 机 科学 的 基石 ， 算 法 理论 研究 的 是 算法 的 设计 技术 和 分 析 技 术 。 前 者 
回答 的 是 “对 特定 的 问题 ， 如 何 提出 一 个 算法 来 求解 ? ”这 样 的 问题 ， 即 如 何 设计 一 个 有 效 的 
算法 解决 特定 的 问题 ， 后 者 回答 的 是 “该 算法 是 否 足 够 好 ? ”， 即 对 已 设计 的 算法 如 何 评价 或 
判断 其 优 劣 ， 或 者 对 求解 同一 个 问题 的 多 个 算法 如 何 进行 比较 和 评价 。 二 者 是 互相 依存 的 ， 设 
计 出 的 算法 需要 检验 和 评价 ， 对 算法 的 分 析 反 过 来 又 可 以 帮助 改进 算法 的 设计 。 


8.1 算法 设计 与 分 析 的 基本 概念 


8.1.1 算法 


算法 Algorithm) 是 对 特定 问题 求解 步骤 的 一 种 描述 ， 它 是 指令 的 有 限 序 列 ， 其 中 每 一 条 
指令 表示 一 个 或 多 个 操作 。 此 外 ， 一 个 算法 还 具有 下 列 5 个 重要 特性 。 

(1) 有 穷 性 。 一 个 算法 必须 总 是 〈 对 任何 合法 的 输入 值 ) 在 执行 有 穷 步 之 后 结束 ， 且 每 一 
步 都 可 在 有 穷 时 间 内 完成 。 

(2) 确定 性 。 算 法 中 的 每 一 条 指令 必须 有 确切 的 含义 ， 理 解 时 不 会 产生 二 义 性 。 并 且 在 任 
何 条 件 下 ， 算 法 只 有 唯一 的 一 条 执行 路 径 ， 即 对 于 相同 的 输入 只 能 得 出 相同 的 输出 。 

(3) 可 行 性 。 一 个 算法 是 可 行 的 ， 即 算法 中 描述 的 操作 都 可 以 通过 已 经 实现 的 基本 运算 执 
行 有 限 次 来 实现 。 

(4) 输入 。 一 个 算法 有 零 个 或 多 个 输入 ， 这 些 输 入 取 自 于 某 个 特定 的 对 象 的 集合 。 

(5) 输出 。 一 个 算法 有 一 个 或 多 个 输出 ， 这 些 输出 是 同 输入 有 着 某 些 特定 关系 的 量 。 


8.1.2 算法 设计 


算法 设计 是 一 件 非常 困难 的 工作 ， 通 常设 计 一 个 “好 ”的 算法 应 考虑 多 个 目标 ， 包 括 正确 
性 、 可 读 性 、 健 壮 性 和 高 效 性 等 。 由 于 实际 问题 各 种 各 样 ， 问 题 求解 的 方法 千变万化 ， 所 以 算 
法 设计 又 是 一 个 灵活 的 充满 智慧 的 过 程 ， 需 要 设计 人 员 根 据 实际 情况 具体 问题 具体 分 析 。 

存在 多 种 算法 设计 技术 (也 称 为 算法 设计 策略 )， 它 们 是 设计 算法 的 一 般 性 方法 。 已 经 证 
明 这 些 技术 对 于 设计 好 的 算法 非常 有 用 ， 在 掌握 了 这 些 技术 之 后 ， 设 计 新 的 和 有 用 的 算法 会 变 
得 容易 。 经 常 采用 的 算法 设计 技术 主要 有 分 治 法 、 动 态 规划 法 、 贪 心 法 、 回 淹 法 、 分 支 限界 法 、 
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概率 算法 和 近似 算法 等 。 另 外 ， 在 解决 计算 机 领域 以 外 的 问题 时 ， 这 些 技术 也 能 起 到 很 好 的 指 
导 作用 。 


8.1.3 算法 分 析 


通常 ， 求 解 一 个 问题 可 能 会 有 多 种 算法 可 以 选择 ， 选 择 的 主要 标准 首先 是 算法 的 正确 性 、 
可 靠 性 、 简 单 性 和 易 理 解 性 ， 其 次 是 算法 的 时 间 复 杂 度 和 空间 复杂 度 要 低 ， 这 是 算法 分 析 技 术 
的 主要 内 容 。 

从 基本 概念 上 看 ， 算 法 分 析 是 指 对 一 个 算法 所 需要 的 资源 进行 估算 ， 这 些 资源 包括 内 存 、 
通信 带宽 、 计 算 机 硬件 和 时 间 等 ， 所 需要 的 资源 越 多 ， 该 算法 的 复杂 度 就 越 高 。 不 言 而 喻 ， 对 
于 任何 给 定 的 问题 ， 设 计 出 复杂 度 尽 可 能 低 的 算法 是 设计 算法 时 追求 的 重要 目标 。 另 一 方面 ， 
当 给 定 问题 有 很 多 种 算法 时 ， 选 择 其 中 复杂 度 最 低 者 是 一 个 重要 准则 。 因 此 ， 算 法 的 复杂 度 分 
析 对 算法 的 设计 和 选择 有 重要 的 指导 意义 和 实用 价值 。 

而 在 计算 机 资源 中 ， 最 重要 的 是 时 间 和 空间 (存储器 ) 资源 ， 因 此 复杂 度 分 析 主要 包括 时 
间 复 杂 度 和 空间 复杂 度 分 析 。 


8.1.4 算法 的 表示 


常用 的 表示 算法 的 方法 有 自然 语言 、 流 程 图 、 程 序 设计 语言 和 伪 代 码 等 。 

(1) 自然 语言 。 其 最 大 的 优点 是 容易 理解 ,缺点 是 容易 出 现 二 义 性 ， 并 且 算 法 通常 很 元 长 。 

(2) 流程 图 。 其 优点 是 直观 易 懂 , 缺点 是 严密 性 不 如 程序 设计 语言 灵活 性 不 如 自然 语言 。 

(3) 程序 设计 语言 。 其 优点 是 能 用 计算 机 直接 执行 ， 缺 点 是 抽象 性 差 ， 使 算法 设计 者 拘泥 
于 描述 算法 的 具体 细节 ， 和 忽略 了 “好 ”算法 和 正确 逻辑 的 重要 性 。 此 外 ， 还 要 求 算法 设计 者 掌 
握 程 序 设计 语言 及 编程 技巧 。 

(4) 伪 代 码 。 伪 代码 是 介 于 自然 语言 和 程序 设计 语言 之 间 的 方法 ， 它 采用 某 一 程序 设计 语 
言 的 基本 语法 ， 同 时 结合 自然 语言 来 表达 。 计 算 机 科学 家 从 来 没有 对 伪 代 码 的 书写 形式 达成 过 
共识 。 在 伪 代 码 中 ， 可 以 采用 最 具 表达 力 的 、 最 简明 扼要 的 方法 来 表达 一 个 给 定 的 算法 。 

考虑 到 下 午 试题 的 算法 题 不 仅 考核 算法 设计 和 分 析 技 术 , 还 同时 考核 算法 的 C 程序 设计 语 
言 实现 ， 因 此 ， 本 章 采 用 C 程序 设计 语言 表示 算法 。 


8.2 算法 分 析 基 础 


8.2.1 时 间 复 杂 度 
由 于 时 间 复杂 度 与 空间 复杂 度 分 别 对 算法 占用 的 时 间 和 空间 资源 进行 分 析 ， 计 算 方法 相 
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似 ， 且 空间 复杂 度 分 析 相 对 简单 一 些 ， 因 此 下 面 主 要 讨论 时 间 复 杂 度 。 算 法 的 时 间 复 杂 度 分 析 
主要 是 分 析 算 法 的 运行 时 间 ， 即 算法 执行 所 需要 的 基本 操作 数 。 

不 同 规模 的 输入 所 需要 的 基本 操作 数 是 不 相同 的 , 例如 用 同一 个 排序 算法 排序 100 个 数 和 
排序 10 000 个 数 所 需要 的 基本 操作 数 是 不 相同 的 , 因此 考虑 特定 输入 规模 的 算法 的 具体 操作 数 
既是 不 现实 的 也 是 不 必要 的 。 在 算法 分 析 中 ， 可 以 建立 以 输入 规模 为 自 变 量 的 函数 7(n) 来 表 
示 算 法 的 时 间 复 杂 度 。 

即使 对 于 相同 的 输入 规模 ， 数 据 分 布 不 相同 也 影响 了 算法 执行 路 径 的 不 同 ， 因 此 所 需要 的 
执行 时 间 也 不 同 。 根 据 不 同 的 输入 ， 将 算法 的 时 间 复 杂 度 分 析 分 为 3 种 情况 。 

(1) 最 佳 情况 。 使 算法 执行 时 间 最 少 的 和 输入。 一般 情况 下 ， 不 进行 算法 在 最 佳 情况 下 的 时 
间 复 杂 度 分 析 。 应 用 最 佳 情况 分 析 的 一 个 例子 是 已 经 证 明基 于 比较 的 排序 算法 的 时 间 复 杂 度 下 
限 为 Q(nlgn)， 那 么 就 不 需要 白费 力气 去 想方设法 将 该 类 算法 改进 为 线性 时 间 复 杂 度 的 算法 。 

(2) 最 坏 情况 。 使 算法 执行 时 间 最 多 的 输入 。 一 般 会 进行 算法 在 最 坏 时 间 复 杂 度 的 分 析 ， 
因为 最 坏 情况 是 在 任何 输入 下 运行 时 间 的 一 个 上 限 ， 它 给 我 们 提供 一 个 保障 ， 实 际 情况 不 会 比 
这 更 糟糕 。 另 外 ， 对 于 某 些 算法 来 说 ， 最 坏 情况 还 是 相当 频繁 的 。 而 且 对 于 许多 算法 来 说 ， 平 
均 情 况 通 常 与 最 坏 情况 下 的 时 间 复 杂 度 一 样 。 

(3) 平均 情况 。 算 法 的 平均 运行 时 间 ， 一 般 来 说 ， 这 种 情况 很 难 分 析 。 举 个 简单 的 例子 ， 
现 要 排序 10 个 不 同 的 整数 ， 输 入 就 有 10! 种 不 同 的 情况 ， 平 均 情 况 的 时 间 复 杂 度 要 考虑 每 一 
种 输入 及 其 该 输入 的 概率 。 平 均 情 况 分 析 可 以 按 以 下 3 个 步骤 进行 。 

@ 将 所 有 的 输入 按 其 执行 时 间 分 类 。 

@ 确定 每 类 输入 发 生 的 概率 。 

@ 确定 每 类 输入 的 执行 时 间 。 

下 式 给 出 了 一 般 算法 在 平均 情况 下 的 复杂 度 分 析 。 


TOD = 六 xf 


其 中 ，p 表 示 第 i 类 输入 发 生 的 概率 ;表示 第 类 输入 的 执行 时 间 ， 输 入 分 为 m 类 。 
8.2.2 渐进 符号 
以 输入 规模 ”为 自 变量 建立 的 时 间 复杂 度 实 际 上 还 是 较 复杂 的 ， 例 如 am?+bnte, 不 仅 与 输 


入 规模 有 关 ， 还 与 系数 a、b 和 < 有 关 。 此 时 可 以 对 该 函数 做 进一步 的 抽象 ， 仅 考虑 运行 时 间 的 
增长 率 或 称 为 增长 的 量 级 ， 如 忽略 上 式 中 的 低 阶 项 和 高 阶 项 的 系数 ， 仅 考虑 r*。 当 输入 规模 大 
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到 只 有 与 运行 时 间 的 增长 量 级 有 关 时 , 就 是 在 研究 算法 的 渐进 效率 。 也 就 是 说 ， 从 极限 角度 看 ， 
只 关心 算法 运行 时 间 如 何 随 着 输入 规模 的 无 限 增长 而 增长 。 下 面 简单 介绍 3 种 常用 的 标准 方法 
来 简化 算法 的 渐进 分 析 。 

(1) O 记 号。 定义 为 : 给 定 一 个 函数 g(n)，O(g(n)) = {fn): 存 在 正常 数 c 和 no， 使 得 对 所 有 
的 n>no， 有 0<fn)<cg(m)}， 如 图 8-1 (a) 所 示 。O(g(n)) 表 示 一 个 函数 集合 ， 往 往 用 该 记号 
出 一 个 算法 运行 时 间 的 渐进 上 界 。 

(2) Q 记号 。 定 义 为 : 给 定 一 个 函数 g(n)，Q(g(n)) = {fn): 存 在 正常 数 c 和 no， 使 得 对 所 有 
的 n>no， 有 0<scg(n)<f(n) }， 如 图 8-1 (b) 所 示 。Q (eg(n)) 表 示 一 个 函数 集合 ， 往 往 用 该 记号 
给 出 一 个 算法 运行 时 间 的 渐进 下 界 。 

(3) @ 记号 。 定 义 为 : 给 定 一 个 函数 g0)，@(g(D)) = {fn): 存 在 正常 数 c1/、cs 和 no， 使 得 对 
所 有 的 n>nmo， 有 0<cig(n)<f(n) <czg(n)} ， 如 图 8-1 (c) 所 示 。@(g(D)) 表 示 一 个 函数 集合 ， 
往往 用 该 记号 给 出 一 个 算法 运行 时 间 的 渐进 上 界 和 渐进 下 界 ， 即 渐进 紧 致 界 。 


cg(nm) 


G8(N) 


jw 70D 


C8(n) 


mo mo mo 
(a) f (m=O(g(n) (b) f=Q(eln)) (Cc) fn)=©(g(n)) 
图 8-1 记号 O、Q 和 的 图 例 
由 上 述 定 义 可 知 ，f(n)= @(g(n)) 当 且 仅 当 f(n)=O(e(n)) 和 fn)= Qe(n))。 
【 例 8.1】 判断 下 列 等 式 是 否 成 立 。 
(1) 10nm’+4n+2=O(n) (2) 10n’+4nt2=O(m) (3) 10n’+4n+2=O(n) 
(4) 10m+4n+2=Q(n) (5) 10n+4nt2=Q(m) (6) 10n°+4n+2 =Q (n) 


(7) 10n+4n+2=®(n’) (8) 1002+41+2 =9(03) (9) 10n’+4n+2=O(n) 
解 : (1) V (2) V (3) X (4) V (5) X (6) V (7) V (8) x (9) x 


8.2.3 递归 式 
从 算法 的 结构 上 看 ， 算 法 可 以 分 为 非 递归 形式 和 递归 形式 。 非 递归 算法 的 时 间 复 杂 度 分 析 
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较 简单 ， 本 节 主 要 讨论 递归 算法 的 时 间 复 杂 度 分 析 方法 。 
(1) 展开 法 。 将 递归 式 中 等 式 右边 的 项 根据 递归 式 进行 蔡 换 ， 称 为 展开 。 展 开 后 的 项 被 再 
次 展开 ， 如 此 下 去 ， 直 到 得 到 一 个 求 和 表达 式 ， 得 到 结果 。 
1 | 


【 例 82] 来 TO-| Ds 的- 


解 : T(n) = T(n-1)+n 
= Tn-2)+(n-l)+n 


=1+2+...+(n—l)+n 
=n(nt1)2 
= O(n’) 
(2) 代 换 法 。 这 一 名 称 来 源 于 当归 纳 假设 用 较 小 值 时 ， 用 所 猜测 的 值 代替 函数 的 解 。 在 用 
代 换 法 解 递归 式 时 需要 3 个 步 又 猜测 解 的 形式 ， 用 数学 归纳 法 证 明 猜测 的 正确 性 ， 求 出 使 解 
真正 有 效 的 常数 。 
【 例 83] mo)-| 


1 i 
27T(n/2)+n mi 


解 : 首先 猜测 其 解 为 TCD) = O(nlgn)。 目 标 是 要 证 明 T(n)< cnlgn， 其 中 ，c > 0 为 常数 。 
然后 假设 这 个 解 对 mw2 成 立 ， 即 T(n/2) < cnlg(n/2)/2。 
对 递归 式 做 替换 ， 得 到 T(n)<2 cnlg(n/2)/ 2+n 
=cnlgn—cnt+n 
<cnlen (c>1) 
尽管 代 换 法 提供 了 一 种 证 明 递归 式 解 的 正确 性 的 简单 方法 ,但 并 不 存在 通用 的 方法 来 猜测 
递归 式 的 正确 解 ， 这 种 猜测 需要 经 验 ， 有 时 甚至 是 创造 性 的 。 由 于 往往 很 难得 到 “好 ”的 猜测 ， 
因此 这 种 方法 较 难 用 。 
(3) 递归 树 法 。 递 归 树 法 弥补 了 代 换 法 猜测 困难 的 缺点 ， 它 适 于 提供 “好 ”的 猜测 ， 然 后 
用 代 换 法 证 明 。 在 递归 树 中 ， 每 一 个 结 点 都 代表 递归 函数 调用 集合 中 一 个 子 问题 的 代价 。 将 树 
中 每 一 层 内 结 点 的 代价 相 加 得 到 一 个 每 层 代 价 的 集合 ， 再 将 每 层 的 代价 相 加 得 到 递归 式 所 有 层 
的 总 代价 。 当 用 递归 式 表示 分 治 算法 的 时 间 复 杂 度 时 ， 递 归 树 方法 尤其 有 用 。 


【 例 8.4】 确定 70)= {G70 2 po -的 紧 下 办 。 


解 : 用 递归 树 法 求解 ， 图 8-2 (a) 一 〈d) 给 出 了 递归 树 的 构造 过 程 。 
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0 


T(n/2) T(n/2) T(n/2) T(n/2) 
Tln) 
(a) (b) 
cn 
en/2 cn/2 en/2 cen/2 


pe 


T(n/4) T(n/4) T(n/4) T(n/4) 


《&) 
on = cn 
cn/2 cn/2 cn/2 cn  ， ------ 人 2cn 
i 有 WS , 
cn/4 cn/4 cn/l4 oak# = 2cn 
a | 
1 1 1 1 业 
1 1 1 1 负 
1 1 1 1 | 
Ty 70 70 70 RO) mass Ze 
(d) 


图 8-2 与 递归 式 T(x) = 47(n/2)+ cn 对 应 的 递归 树 的 构造 过 程 


将 递归 树 每 一 层 代价 相 加 就 可 以 得 到 递归 式 的 解 ， 如 下 式 所 示 。 


T(n)=(1+2+22 1+-…+28"1)cn+ O(n’) 
=(28"—]D)en+0(n) 
=0(n’) 


(4) 主 方法 。 主 方法 也 称 为 主 定理 ， 给 出 了 求解 以 下 形式 的 递归 式 的 快速 方法 。 
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T(n) = aT(n/b) +f(n) 

其 中 ，a>1 和 b>1 是 常数 ，f(n) 是 一 个 渐进 的 正 函 数 。 

【定理 8.1】 “〈 主 定理 ) 设 a>1 和 b>1 为 常数 ，f(m) 为 函数 ，7T(n) 为 定义 在 非 负 整 数 上 的 
递归 式 ，Z(n) =a7ltn/b)+f(m)， 其 中 ，n/b 指 |n/5 | 或 [n/5|， 那 么 TD 可 能 有 如 下 的 渐进 紧 致 界 。 

(1) 车 对 于 某 常数 a>0， 有 f(n)=O(m*%"5)， 则 T(n)=@(n*%")。 

(2) 车 f(n)= eB(n*3"1g*n)， 则 T(n)= (n° lg n) 。 

(3) 若 对 于 某 常数 a=0， 有 (mn)= Qn*%"**) ， 且 对 于 常数 c<1 与 所 有 足够 大 的 mn 有 
af (b/n) < of (n), 则 T(n)= ©(f(n)). 

【 例 8.5】 用 主 方法 求解 下 列 递归 式 。 

(1) T(n)=9T(n/3)+n 

(2) T(n)=T(2n/3)+1 

(3) T(n)=37T(n/4)+nlgn 

解 : (1) a=9, b=3, f(n)=n。 logsa =2，f(n)=O(ln*&”)，, 其 中 , =1, 属于 情况 (1)， 
因此 有 7T(n) = @(n*%°)= eB(n?)。 

(2) a=1, b=3/2, f(n)=1。 logsa=0，f(n)=O(n*8°1g*n), 其 中 , k=0, 属于 情况 (2)， 
因此 有 TCD) = (ns lg**1n) = (lgn) 。 

(3) a=3, b=4, f(n)=nlgn。 logsa ~ 0.793，f(n)=Q(n*+)， 其中，s 全 0.207， 
属于 情况 (3)， 因 此 有 7T(n)= 8@(f(n))= eB(nlgn)。 


8.3 ”分 治 法 
8.3.1 递归 的 概念 


递归 是 指 子 程序 (或 函数 ) 直接 调用 自己 或 通过 一 系列 调用 语句 间接 调用 自己 ， 是 一 种 描 
述 问 题 和 解决 问题 的 常用 方法 。 在 计算 机 算法 设计 与 分 析 中 ， 递 归 技 术 是 十 分 有 用 的 。 使 用 递 
归 技术 往往 使 函数 的 定义 和 算法 的 描述 简洁 且 易 于 理解 。 还 有 一 些 问题 ， 虽 然 其 本 身 并 没有 明 
显 的 递归 结构 ， 但 用 递归 技术 来 求解 使 设计 出 的 算法 简洁 易 懂 且 易 于 分 析 ， 为 此 在 介绍 其 他 算 
法 设计 方法 之 前 先 讨论 它 。 

递归 有 两 个 基本 要 素 : 边界 条 件 ， 即 确定 递归 到 何 时 终止 ， 也 称 为 递归 出 口 ， 递 归 模 式 ， 
即 大 问题 是 如 何 分 解 为 小 问题 的 ， 也 称 为 递归 体 。 

【 例 8.6】 阶乘 函数 。 

阶乘 函数 可 递归 地 定义 为 : 
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.n=0 
n!l= 
n(n—D!,n>0 
阶乘 函数 的 自 变量 n 的 定义 域 是 非 负 整数 ,递归 式 的 第 一 式 给 出 了 这 个 函数 的 一 个 初始 值 ， 
是 递归 的 边界 条 件 。 递 归 式 的 第 二 式 是 用 较 小 自 变量 的 函数 值 来 表示 较 大 自 变量 的 函数 值 的 方 
式 来 定义 的 阶乘 ， 是 递归 体 。n! 可 以 递归 地 计算 如 下 : 
int Factorial(int num){ 
if(nmum 一 0) 
retum 1; 
ifnum> 0) 


return num * Factorial(num - 1); 


} 
8.3.2 分 治 法 的 基本 思想 


分 治 与 递归 就 像 一 对 挛 生 兄弟 ， 经 常 同 时 应 用 于 算法 设计 之 中 ， 并 由 此 产生 许多 高 效 的 算 
法 。 我 们 知道 ， 任 何 一 个 可 以 用 计算 机 求解 的 问题 所 需要 的 计算 时 间 都 与 其 规模 有 关 。 问 题 的 
规模 越 小 ， 解 题 所 需要 的 计算 时 间 往 往 越 少 ， 从 而 较 容易 处 理 。 例 如 ， 对 于 个 元 素 的 排序 问 
题 ， 当 n=1 时 ， 不 需要 任何 比较 ， 当 n=2 时 ， 只 要 做 一 次 比较 即 可 ;…… 而 当 n 较 大 时 ， 问 题 
就 不 那么 容易 处 理 了 。 要 想 直 接 解 决 一 个 较 大 的 问题 ， 有 时 是 相当 困难 的 。 分 治 法 的 设计 思想 
是 将 一 个 难以 直接 解决 的 大 问题 分 解 成 一 些 规模 较 小 的 相同 问题 ， 以 便 各 个 击破 ， 分 而 治之 。 
如 果 规 模 为 n 的 问题 可 分 解 成 个 子 问题 ，1<k<n， 这 些 子 问题 互相 独立 且 与 原 问 题 相同 。 分 
治 法 产生 的 子 问题 往往 是 原 问题 的 较 小 模式 ， 这 就 为 递归 技术 提供 了 方便 。 

一 般 来 说 ， 分 治 算法 在 每 一 层 递归 上 都 有 3 个 步 又。 

(1) 分 解 。 将 原 问题 分 解 成 一 系列 子 问题 。 

(2) 求解 。 递 归 地 求解 各 子 问题 。 若 子 问题 足够 小 ， 则 直接 求解 。 

(3) 合并 。 将 子 问题 的 解 合并 成 原 问题 的 解 。 
8.3.3 分 治 法 的 典型 实例 


以 上 讨论 的 是 分 治 法 的 基本 思想 和 一 般 原 则 ， 下 面 用 一 些 具 体例 子 来 说 明 如 何 针对 具体 问 
题 用 分 治 思 想来 设计 有 效 算法 。 

【 例 8.7】 归并 排序 。 

归并 排序 算法 是 成 功 应 用 分 治 法 的 一 个 完美 的 例子 , 其 基本 思想 是 将 待 排 序 元 素 分 成 大 小 
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大 致 相同 的 两 个 子 序列 ， 分 别 对 这 两 个 子 序列 进行 排序 ， 最 终 将 排 好 序 的 子 序列 合并 为 所 要 求 
的 序列 。 归 并 排序 算法 完全 依照 上 述 分 治 算法 的 3 个 步骤 进行 。 

(1) 分 解 。 将 n 个 元 素 分 成 各 含 w2 个 元 素 的 子 序列 。 

(2) 求解 。 用 归并 排序 对 两 个 子 序列 递归 地 排序 。 

(3) 合并 。 合 并 两 个 已 经 排 好 序 的 子 序列 以 得 到 排序 结果 。 

归并 排序 算法 的 C 代码 如 下 : 


void MergeSort(int A[],int p,int 7){ 
int q; 
这 p<D{ 
q=p+D/2; 
MergeSort(A,p,q); 
MergeSort(A,q + 1.D; 
Merge(A.p,q.D; 


} 
函数 Merge(A, p, q,D 的 C 代码 如 下 : 


void Merge(int A[],int p,int q,int ?){ 
intnl =q—p+1,n2=r-q,i,j,k; 
intL[50].R[50]: 
for(i=0:1<nl1;it+) 
LL]=Alp+i]; 
for( = 0:j <n2:j++) 
RD] =A[lqtit1]; 
LInl] = INT_ MAX:; 
RIn2] =INT MAX: 
i=0; 
j=0; 
fork=p;k<rt+1;kt)t{ 
ifLE] < ROD{ 
AIk = LO]: 
计 +; 
} 
else{ 
A[k] = RD]: 


有 
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} 


其 中 , 4 是 数组 ,， p、g 和 + 是 下 标 , 满足 p<q<r。Merge 显然 可 在 O(n) 时间 内 完成 ， 因 此 合并 
排序 算法 对 个 元 素 进行 排序 所 需 的 计算 时 间 7(n) 满足 : 


rw- .n<l 
2T(n/2)+O(n) ,n>1 


解 此 递归 式 可 知 T(n) = O(nlogn) 。 
【 例 8.8】 最 大 子 段 和 问题 。 
给 定 由 n 个 整数 (可 能 有 负 整 数 ) 组 成 的 序列 a,a,,…,a, ， 求 该 序列 形 如 a 的 子 段 和 


ki 

的 最 大 值 。 当 序列 中 所 有 整数 均 为 负 整 数 时 ， 其 最 大 子 段 和 为 0。 依 此 定义 ， 所 求 的 最 大 值 为 
页 

mons ol 


k=i 


4 
例如 ， 当 (a1,4,,43,44,4s,46)=(-2,11,-4,13,-5,-2) 时 ， 最 大 子 段 和 为 > at = 20。 


k=2 


最 大 子 段 和 问题 的 分 治 策略 如 下 。 

(1) 分 解 。 如 果 将 所 给 的 序列 4[1..n] 分 为 长 度 相等 的 两 段 4[1..n/2] 和 4[n/2+1..n]， 分 别 求 
出 这 两 段 的 最 大 子 段 和 ， 则 4[1..n] 的 最 大 子 段 和 有 3 种 情形 。 

@ 4[1..n] 的 最 大 子 段 和 与 4[1..n/2] 的 最 大 子 段 和 相同 。 

@ 4[1..n] 的 最 大 子 段 和 与 4[n/2+1..n] 的 最 大 子 段 和 相同 。 


@) 4[1. 几 的 最 大 子 段 和 为 立 w ， 且 1<ign/2, n/2+1<j<n。 
本 


(2) 解决 。 四 和 人 @ 这 两 种 情形 可 递归 求 得 。 对 于 情形 @， 容 易 看 出 ，4[w2] 与 4[w2+1] 在 最 
n/2 

优 子 序列 中 。 因 此 可 以 在 4[1..n/2] 中 计算 出 s1= max, ,alk] ， 并 在 4[m/2+1..n] 中 计算 出 
‘ign Wt 


52= max 了 al 各 。 则 slts2 即 为 出 现 情形 @@ 的 最 优 值 。 


n/2+1<i<n pp 

(3) 合并 。 比 较 在 分 解 阶段 的 3 种 情况 下 的 最 大 子 段 和 ， 取 三 者 之 中 的 较 大 者 为 原 问题 
的 解 。 

据 此 可 设计 出 求解 最 大 子 段 和 的 分 治 算法 如 下 。 
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int MaxSubSum(int *Array, int left int right) { 
int sum = 0; 
inti; 
ileft == right){ /* 分 解 到 单个 整数 ， 不 可 继续 分 解 */ 
if(Array[left] > 0) 
sum = Array[left]: 
else 
sum = 0; 
} 
else{ 
伴 从 left 和 right 的 中 间 分 解数 组 */ 
int center = (left + right) /2; ”人 #* 划 分 的 位 置 */ 
int leftsum = MaxSubSum(Array,left,center); 
int rightsum = MaxSubSum(Array,center+1,right); 
席 计 算 包 含 center 的 最 大 值 ， 判 断 是 情形 1、 情 形 2 还 是 情形 3*/ 
intsl = 0; 
int lefts = 0; 
for(i = center:I >= left:i--){ 
lefts = lefts + Array[i]: 
if(lefts > s1) 
sl = lefts; 
; 
int s2 = 0; 
int rights = 0; 
for(i = center + 1;1 <= right:i++){ 
Tights = rights + Array[j]: 


if(rights > s2) 
s2 = rights; 
} 
sum = sl+s2; 


/情形 1q 

if(sum < leftsum) 
sum = leftsum; 

人 # 情 形 2*/ 

if(sum < rightsum) 


sum = rightsum:; 
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Tetum sum; 


} 


其 中 ，Amay 为 数组 ，left 和 right 表示 数组 下 标 。 对 于 长 度 为 n 的 序列 ， 可 以 调用 MaxSub 
Sum(Array, 0,n - 1) 来 获得 其 最 大 子 段 和 。 

分 析 算 法 时 间 复 杂 度 如 下 : 对 应 分 解 中 的 和 @ 两 种 情形 ， 需 要 分 别 递归 求解 ， 对 应 情 
形 @@， 两 个 并 列 for 循环 的 时 间 复杂 度 为 O(n) ， 因 此 得 到 下 列 递归 式 。 


_fo0w ns1 
= 1 /D+O(m,n>1 


解 此 递归 式 可 知 T(n) = O(nlogn) 。 
8.4 动态 规划 法 


8.4.1 动态 规划 法 的 基本 思想 


动态 规划 算法 与 分 治 法 类 似 ， 其 基本 思想 也 是 将 待 求解 问题 分 解 成 若干 个 子 问题 ， 先 求解 
子 问题 ， 然 后 从 这 些 子 问 题 的 解 得 到 原 问 题 的 解 。 与 分 治 法 不 同 的 是 ， 适 合用 动态 规划 法 求解 
的 问题 ， 经 分 解 得 到 的 子 问题 往往 不 是 独立 的 。 若 用 分 治 法 来 解 这 类 问题 ， 则 相同 的 子 问题 会 
被 求解 多 次 ， 以 至 于 最 后 解决 原 问题 需要 耗费 指数 级 时 间 。 然 而 ， 不 同 子 问题 的 数目 常常 只 有 
多 项 式 量 级 。 如 果 能 够 保存 已 解决 的 子 问题 的 答案 ， 在 需要 时 再 找 出 已 求 得 的 答案 ， 这 样 就 可 
以 避免 大 量 的 重复 计算 ， 从 而 得 到 多 项 式 时 间 的 算法 。 为 了 达到 这 个 目的 ， 可 以 用 一 个 表 来 记 
录 所 有 已 解决 的 子 问题 的 答案 。 不 管 该 子 问题 以 后 是 否 被 用 到 ， 只 要 它 被 计算 过 ， 就 将 其 结 
填 入 表 中 。 这 就 是 动态 规划 法 的 基本 思路 。 

动态 规划 算法 通常 用 于 求解 具有 某 种 最 优 性 质 的 问题 。 在 这 类 问题 中 ， 可 能 会 有 许多 可 行 
解 ， 每 个 解 都 对 应 于 一 个 值 ， 我 们 希望 找到 具有 最 优 值 〈 最 大 值 或 最 小 值 ) 的 那个 解 。 当 然 ， 
最 优 解 可 能 会 有 多 个 ， 动 态 规划 算法 能 找 出 其 中 的 一 个 最 优 解 。 设 计 一 个 动态 规划 算法 ， 通 党 
按照 以 下 几 个 步骤 进行 。 

(1) 找 出 最 优 解 的 性 质 ， 并 刻画 其 结构 特征 。 

(2) 递归 地 定义 最 优 解 的 值 。 

(3) 以 自 底 向 上 的 方式 计算 出 最 优 值 。 

(4) 根据 计算 最 优 值 时 得 到 的 信息 ， 构 造 一 个 最 优 解 。 

步骤 (1) 一 (3) 是 动态 规划 算法 的 基本 步骤 。 在 只 需要 求 出 最 优 值 的 情形 下 ， 步 骤 (4) 
可 以 省 略 。 若 需要 求 出 问题 的 一 个 最 优 解 ， 则 必须 执行 步骤 (4)。 此 时 ， 在 步骤 (3) 中 计算 
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最 优 值 时 ， 通 常 需 记 录 更 多 的 信息 ， 以 便 在 步骤 (4) 中 根据 所 记录 的 信息 快速 构造 出 一 个 最 
优 解 。 

动态 规划 法 是 一 个 非常 有 效 的 算法 设计 技术 , 那么 何 时 可 以 应 用 动态 规划 来 设计 算法 呢 ? 
对 于 一 个 给 定 的 问题 ， 若 其 具有 以 下 两 个 性 质 ， 可 以 考虑 用 动态 规划 法 来 求解 。 

(1) 最 优 子 结构 。 如 果 一 个 问题 的 最 优 解 中 包含 了 其 子 问题 的 最 优 解 ， 就 说 该 问题 具有 最 
优 子 结构 。 当 一 个 问题 具有 最 优 子 结构 时 ， 提 示 我 们 动态 规划 法 可 能 会 适用 ， 但 是 此 时 贪心 策 
略 可 能 也 是 适用 的 。 

(2) 重 伙 子 问题 。 重 受 子 问题 指 用 来 解 原 问题 的 递归 算法 可 反复 地 解 同样 的 子 问题 ， 而 不 
是 总 在 产生 新 的 子 问题 。 即 当 一 个 递归 算法 不 断 地 调用 同一 个 问题 时 ， 就 说 该 问题 包含 重 芝 子 
问题 。 此 时 若 用 分 治 法 递归 求解 ， 则 每 次 遇 到 子 问题 都 会 视 为 新 间 题 ， 会 极 大 地 降低 算法 的 效 
率 ， 而 动态 规划 法 总 是 充分 利用 重 伙 子 问题 ， 对 每 个 子 问 题 仅 计算 一 次 ， 把 解 保 存在 一 个 在 需 
要 时 就 可 以 查看 的 表 中 ， 而 每 次 查 表 的 时 间 为 常数 。 
8.4.2 动态 规划 法 的 典型 实例 


【 例 8.9】 0-1 背包 问题 。 

有 nn 个 物品 , 第 i 个 物品 价值 为 vi, 重量 为 wi, 其 中 vi 和 wi 均 为 非 负 数 , 背包 的 容量 为 静 
歼 为 非 负数 。 现 需要 考虑 如 何 选 择 装 入 背包 的 物品 ， 使 装 入 背包 的 物品 总 价值 最 大 。 该 问题 可 
以 形式 化 描述 如 下 : 

目标 函数 为 max vx 

i=1 


约束 条 件 为 Dwx; <W，x etod 


满足 约束 条 件 的 任 一 集合 (x, x2,…, xn) 是 问题 的 一 个 可 行 解 ， 问 题 的 目标 是 要 求 问 题 的 
一 个 最 优 解 。 考 虑 一 个 实例 ， 假 设 z= 5， 丈 = 17， 每 个 物品 的 价值 和 重量 如 表 8-1 所 示 ， 可 将 
物品 1、2 和 5 装 入 背包 ， 背 包 未 满 ， 获 得 价值 22， 此 时 间 题 解 为 (1，1，0，0，1); 也 可 以 
将 物品 4 和 5 装 入 背包 ， 背 包装 满 ， 获 得 价值 24， 此 时 解 为 (0，0，0，1，1)。 


表 8-1 物品 的 价值 和 重量 


物品 编号 2 3 5 
价值 4 5 10 13 
重量 w 4 人 9 


下 面 根据 动态 规划 的 4 个 步骤 求解 该 问题 。 
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(1) 刻画 0-1 背包 问题 的 最 优 解 的 结构 。 
可 以 将 背包 问题 的 求解 过 程 看 作 是 进行 一 系列 的 决策 过 程 ， 即 决定 哪些 物品 应 该 放 入 背 
包 , 哪些 物品 不 放 入 背包 。 如 果 一 个 问题 的 最 优 解 包含 了 物品 n， 即 x = 1， 那 么 其 余 ma za，…， 
2 一 定 构成 子 问题 1,2,…,n-l 在 容量 为 时 的 最 优 解 。 如 果 这 个 最 优 解 不 包含 物品 mw， 即 
各 =0， 那 么 其 余 mu mm …, 2 一 定 构成 子 问题 1,2…,n-l 在 容量 为 丈 时 的 最 优 解 。 
(2) 递归 定义 最 优 解 的 值 。 
根据 上 述 分 析 的 最 优 解 的 结构 递归 地 定义 问题 最 优 解 。 设 c[i, w] 表 示 背 包容 量 为 w 时 i 个 
物品 导致 的 最 优 解 的 总 价值 ， 得 到 下 式 。 显 然 ， 问 题 要 求 c[n, 多。 
0 ,i 二 0 或 w=0 
cli,w]=1c[i—1,w] Wh>w 
max{ci—l,w—wl]+v,ci—-l,w])} ,i>0Hw <w 


(3) 计算 背包 问题 最 优 解 的 值 。 
基于 上 述 递归 式 ， 以 自 底 向 上 的 方式 计算 最 优 解 的 值 ，C 代码 如 下 : 


int** KnapsackDP(int n,int W,int* Weights,float* Values){ 
int i,W:; 
必 为 二 维 数组 申请 空间 并 
int** ¢ = (int **)malloc(sizeof(int *)*(n + 1)); 
for(i=0;i<=n;i++) 
c[i] = (int *)malloc(sizeoflint)*(W + 1)); 
雍 初 始 化 二 维 数组 */ 
for(w= 0:w <= W;w++) 
c[OJ[w] = 0; 
fori = 1;1<= Dii++H){ 
csD[0] = 0; 
for(w = l;w <= W;w++){ 
if(Weights[i- 1] <= w){ * 如 果 背 包 剩余 重量 大 于 物品 重量 */ 
if(Values[i- 1] + c[i- 1][w - Weights[i - 1]] > cli- 1][w) 
{ ”* 重 量 为 w 的 背包 中 放 入 该 物品 */ 
c[il[w] = Values[i- 1] + c[i- 1][w -Weights[i - 1]]; 


} 

else{ 
人 # 重 量 为 w 的 背包 中 不 放 入 该 物品 */ 
cLI[w] = cfi- 1J[w]: 

} 
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else 
cw = cli- Ew; 


Teturn c; 


上 述 C 代码 的 时 间 复 杂 度 为 O(n 克 。 表 8-2 给 出 了 上 述 实 例 填 表 的 信息 ， 从 表 中 可 以 很 容 
易 地 看 出 最 优 解 的 值 为 24。 


表 8-2 ”0-1 背包 问题 的 动态 规划 法 示例 


有 


(4) 根据 计算 的 结果 构造 问题 最 优 解 。 
根据 上 一 步 计算 的 < 数组 很 容易 构造 问题 的 最 优 解 。 判 断 cfi, Ww] 与 cf 二 1, w] 的 值 是 否 相 等 ， 
若 相等 ， 则 说 明 x = 0， 和 否则 为 1。 得 到 最 优 解 的 C 代码 如 下 : 


void OutputKnapsackDP(int n,int W.int * Weights,float *Values,int **c){ 
int x[n]; 
int i; 
for(i=n:i> 1;1--){ 
if(c[i][W] = cli- 1][W])) 让 重量 为 W 的 最 优选 择 的 背包 中 不 包含 该 物品 */ 


x[i-1] = 0: 
else{ 
x[i1- 1]= 1; 
W=W -Weights[i-1]; 。/* 更 新 背包 目前 的 最 大 容量 */ 
} 
} 
if(c[1][W] = 0) 上 第 一 个 物品 不 放 入 背包 */ 
x[0] = 0; 


else 记 第 一 个 物品 放 入 背包 */ 
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x[0]= 1; 
for(i= 0;i<n:it+) 
if(x[] = D) 
Printf("Weigh: %d,Value: %f\n", Weights[i],Values[i]); 
} 


构造 最 优 解 的 时 间 复 杂 度 为 O(n)。 在 上 述 例 子 中 , C [5,17]=24 疼 C [4,17]=21, xs=1; C [4,8]= 
11C [3,8]=10，x4=1; C [2,0]=C[2,0]=C[1,0]=0，x=xz=x1=0， 因 此 最 优 解 为 0,0,0,1,1)。 

【 例 8.10】 最 长 公共 子 序列 (LCS)。 

非 形式 化 地 讲 ， 子 序列 是 指 从 给 定 序列 中 随意 地 〈 不 一 定 是 连续 的 ) 去 掉 若 干 元 素 ( 可 能 
一 个 也 不 去 掉 ) 后 所 形成 的 序列 。 令 序列 瑟 = mm …xw ， 序 列 了 = 及 六 …… 玉 是 三 的 子 序列 ， 
存在 天 的 一 个 严格 递增 下 标 序列 <, 记 ,…, 计 >， 使 得 对 于 所 有 的 j=1,2,…,k 及 ,=yj 。 例 如， 
=A4BCBD4B，Y=BCDB， 则 Y 是 于 的 一 个 子 序列 。 

给 定 两 个 序列 王 和 了 ，, 称 序列 Z 是 了 和 Y 的 公共 子 序列 , 是 指 Z 同时 是 了 和 Y 了 的 子 序列 。 
最 长 公共 子 序列 问题 定义 为 : 给 定 序 列 佬 =x，… 坟 ,和 序列 了 = yy… y， 求 这 两 个 序列 的 最 
长 公共 子 序列 。 

如 果 用 穷 举 法 求解 该 问题 ,列举 出 于 的 所 有 子 序列 ,一 一 检查 其 是 否 是 了 的 子 序列 ， 并 随 
时 记录 所 发 现 的 公共 子 序 列 ， 最 终 求 出 最 长 公共 子 序列 ， 时 间 复 杂 度 为 0(2”n)， 是 指数 级 的 时 
间 复杂 度 ， 对 于 长 序列 来 说 不 可 行 。 而 动态 规划 法 可 以 有 效 地 求解 最 长 公共 子 序列 问题 。 

(1) 刻画 最 长 公共 子 序列 问题 的 最 优 子 结构 。 

定理 8.2 证 明了 LCS 具有 最 优 子 结构 。 

【定理 8.2】 LCS 的 最 优 子 结构 。 设 蕊 =2z … xm 和 了 = 及 六 …… 思 是 两 个 序列 ， 
Z=32… 么 是 世 和 了 的 一 个 最 长 公共 子 序列 。 

@ 如 果 xo=p， 那 么 5xm=yn， 且 Zi 是 融 1 和 五 的 一 个 最 长 公共 子 序 列 。 

@ 如 果 吉 冯 y。。 ， 那 么 xxzm， 殖 含 着 Z 是 吾 ,1 和 了 的 一 个 最 长 公共 子 序列 。 

图 如 果 坟 去， 那么 24 关 》»， 蕴 含 着 Z 是 于 和 三, 的 一 个 最 长 公共 子 序列 。 

(2) 递归 定义 最 优 解 的 值 。 

设 丘 .用 表示 序列 下 和 五 的 最 长 公共 子 序列 的 长 度 ， 如果 二 0 或 产 0， 则 其 中 有 一 个 序列 长 
度 为 0， 因 此 LCS 长 度 为 0。 由 LCS 的 最 优 子 结构 可 导出 以 下 递归 式 。 

0 ,i=0 或 =0 
Ti]=4Mi-Lj-1+1 ij>0Hx; =y,; 
max(I[i—1,], [i,j—1),i.j > 0Hx; #y; 
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(3) 计算 最 优 解 的 值 。 

根据 上 述 递归 式 自 底 向 上 地 求 出 最 优 解 的 值 。 将 后 ,四 的 值 存储 在 表 0..m,1..n] 中 ， 以 行为 
主 序 从 左 到 右 计 算 表 1 中 的 元 素 ， 同 时 维持 表 b[1..m,1..n]， 用 其 中 的 元 素 b[i, 用 记录 使 得 开刀 
取 最 优 值 的 最 优 子 结构 。 以 下 给 出 该 算法 的 C 代码 , 分 别 用 strl 和 str2 表示 序列 和 YY。 


int** Les_ Length(const char* strl,const char* str2,int str]_length,int str2 length){ 
int 1j; 
让 为 矩阵 1、b 分 配 空间 */ 
int** ] = (int **)malloc(sizeof(int *)*(str]_length + 1)); 
int** b= (int **)malloc(sizeof(int *)*(str]_length + 1)):; 
for (1=0;1<= strl_length; 1H){ 
1D] = (int *)malloc(sizeof(int)*(str2_length + 1)); 
b[i] = (Gint *)malloc(sizeof(int)*(str2_length + 1)); 


} 
上 初始 化 矩阵 */ 
for(i= 1;i<= strl length:i++) 
lJ[0] =0; 
for(i= 0:i <= str2_length;i++) 
1[0][] =0; 
for(i= 1;i <= str]_length;i++){ 
for( = 1;j <= str2_length:j++){ 
if(strl[i- 1] = str20 - 1){ 
lI0]=1- 6- +1; 
b[i0]=0; 让 0 代表 指向 右上 方 的 箭头 */ 
} 
else if([i- 1]0] >=10]0 - 1){ 
0]= 1 - 0]: 
blI0]=1; 人 #]1 代表 指向 上 方 的 箭头 */ 


} 
else{ 
0]=106- 1]:; 
bDD]=2; /*2 代表 指向 右 方 的 第 头 */ 
} 
} 
} 
return b; 


从 上 述 C 代码 可 知 ， 算 法 的 时 间 复 杂 度 为 O(mn)。 根 据 上 述 算 法 ， 已 知 三 4BCBD4B 和 
瑟 BDC4B4， 则 对 应 的 表 1 和 5 如 图 8-3 所 示 。 
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区 
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图 8-3 用 动态 规划 求解 LCS 问题 示例 


(4) 构造 最 优 解 。 

用 表 b 中 的 信息 构造 了 和 了 的 一 个 LCS。 从 b[m, 如 开始 ， 在 表 中 沿 着 箭头 的 方向 跟踪 ， 
当 b[i, 有 ]="N" 时 ， 表 示 x = 为 LCS 中 的 元 素 ，C 代码 如 下 所 示 ， 分 别 用 strl 和 str2 表示 序列 
X 和 站 。 在 图 8-3 所 示 的 例子 中 ， 过 程 OutputLCS 将 产生 以 下 输出 : BCBA。 


void OutputLcs(const char *strl,const int** b,int strl_length,int str2 length){ 
if(strl_length 一 0llstr2_length 一 0) /* 两 个 字符 串 中 任何 一 个 长 度 为 零 */ 
Teturn; 
if(b[strl_length][str2_length] 一 0){ /* 篆 头 指向 右上 */ 
OutputLes(strl,b,strl_length - 1,str2 length - 1); 
printf("%c",strl [strl_length - 1]); 


} 
else if(b[strl_length][str2_length] 一 1) /* 箭 头 指向 上 */ 
OutputLecs(strl,b,strl_length-1,str2_length): 


else 访 箭 头 指向 右 */ 
OutputLes(strl,b,strl_length,str2 length-1): 


8.5 ”贪心 法 


8.5.1 贪心 法 的 基本 思想 


作为 一 种 算法 设计 技术 ， 贪 心 法 是 一 种 简单 的 方法 。 和 动态 规划 法 一 样 ， 贪 心 法 也 经 常用 
于 解决 最 优化 问题 。 与 动态 规划 法 不 同 的 是 ， 贪 心 法 在 解决 问题 的 策略 上 是 仅 根据 当前 已 有 的 
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信息 做 出 选择 ,而 且 一 旦 做 出 了 选择 , 不 管 将 来 有 什么 结果 ， 这 个 选择 都 不 会 改变 。 换 而 言 之 ， 
贪心 法 并 不 是 从 整体 最 优 考 虑 ， 它 所 做 出 的 选择 只 是 在 某 种 意义 上 的 局 部 最 优 。 这 种 局 部 最 优 
选择 并 不 能 保证 总 能 获得 全 局 最 优 解 ， 但 通常 能 得 到 较 好 的 近似 最 优 解 。 举 一 个 简单 的 贪心 法 
例子 ， 平 时 购物 找 钱 时 ， 为 使 找 回 的 零钱 的 硬币 数 最 少 ， 从 最 大 面值 的 币 种 开始 ， 按 递减 的 顺 
序 考虑 各 币 种 ， 先 尽量 用 大 面值 的 币 种 ， 当 不 足 大 面值 币 种 的 金额 时 才 去 考虑 下 一 种 较 小 面值 
的 币 种 ， 这 就 是 在 采用 贪心 法 。 这 种 方法 在 这 里 总 是 最 优 ， 是 因为 银行 对 其 发 行 的 硬币 种 类 和 
硬币 面值 的 巧妙 安排 。 如 果 只 有 面值 分 别 为 1、5 和 11 单位 的 硬币 ， 而 希望 找 回 总 额 为 15 单 
位 的 硬币 ， 按 贪心 算法 ， 应 找 1 个 11 单位 面值 的 硬币 和 4 个 1 单位 面值 的 硬币 ， 共 找 回 5 个 
硬币 。 但 最 优 的 解答 应 是 3 个 5 单位 面值 的 硬币 。 

我 们 知道 ， 贪 心算 法 并 不 总 能 得 到 最 优 解 ， 那 么 对 于 一 个 具体 的 问题 ， 如 何 得 知 是 否 可 以 
用 贪心 法 来 求解 以 及 能 和 否 得 到 问题 的 最 优 解 呢 ? 这 个 问题 很 难得 到 肯定 的 回答 。 但 是 ， 从 许多 
可 以 用 贪心 法 求 得 最 优 解 的 问题 中 看 到 ， 这 类 问题 一 般 具 有 两 个 重要 的 性 质 。 

(1) 最 优 子 结构 。 当 一 个 问题 的 最 优 解 包含 其 子 问题 的 最 优 解 时 ， 称 此 问题 具有 最 优 子 结 
构 。 问 题 具 有 最 优 子 结构 是 该 问题 可 以 采用 动态 规划 法 或 者 贪心 法 求解 的 关键 性 质 。 

(2) 贪心 选择 性 质 。 指 问题 的 整体 最 优 解 可 以 通过 一 系列 局 部 最 优 的 选择 ， 即 贪心 选择 来 
得 到 。 这 是 贪心 法 和 动态 规划 法 的 主要 区 别 。 证 明 一 个 问题 具有 贪心 选择 性 质 也 是 贪心 法 的 一 
个 难点 。 


8.5.2 ”贪心 法 的 典型 实例 


【 例 8.11】 活动 选择 问题 。 

活动 选择 问题 是 指 若 干 个 具有 竞争 性 的 活动 要 求 互 斥 使 用 某 一 公共 资源 时 如 何 选择 最 大 
的 相 容 活动 集合 .假设 有 一 个 需要 使 用 某 一 资源 (如 教室 等 ) 的 n 个 活动 组 成 的 集合 5S={ai, az，…， 
an}, 该 资源 一 次 只 能 被 一 个 资源 占用 。 每 个 活动 ;有 一 个 开始 时 间 s; 和 结束 时 间 f, 且 0<s;< 灰 
c。 一 旦 被 选择 后 ， 活 动 a; 就 占据 半 开 时 间 区 间 [si, 月 。 如 果 两 个 活动 w 和 gj 的 时 间 区 间 互 不 
重 营 ， 则 称 活动 a; 和 aj 是 兼容 的 。 活 动 选择 问题 就 是 要 选择 出 一 个 由 互相 兼容 的 活动 组 成 的 最 
大 子 集合 。 考虑 表 8-3 中 的 活动 集合 ,其 中 各 活动 已 经 按 结束 时 间 的 单调 递增 顺序 进行 了 排序 。 
从 表 中 可 以 看 到 ， 子 集 {a3, ae, an} 由 相互 兼容 的 活动 组 成 。 然 而 ， 它 不 是 最 大 的 子 集 ， 子 集 {ai， 
ad, 4s, 4u} 更 大 。 事实 上 ，{a1, as, as, an} 是 一 个 最 大 的 相互 兼容 活动 子 集 。 另外， 还 有 一 个 最 大 


子 集 是 {qz, a4, ao, an}。 


表 8-3 活动 集合 
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经 分 析 ， 该 问题 具有 最 优 子 结构 ， 可 以 用 动态 规划 法 求解 。 但 同时 该 问题 还 具有 贪心 选择 
性 质 ， 因 此 可 以 用 贪心 法 更 简单 地 求解 。 

定义 集合 5 = {at sS: <s < 大 <s。 为 了 完整 地 表示 问题 ， 加 入 两 个 虚拟 活动 ae 和 
anm， 其中， 有 =0，swnmy= 吕 ， 这 样 S-So wa。 

【定理 8.3】 对 于 任意 非 空子 问题 %， 设 a 是 Sy 中 具有 最 早 结束 时 间 的 活动 。 

那么 ，(1) 活动 wm 在 5; 的 某 个 最 大 兼容 活动 子 集中 。 

(2) 子 问题 gm 为 宝 ， 所 以 选择 on 将 使 5 为 唯一 可 能 非 空 的 子 问题 。 

(证 明 略 》 

假设 对 ”个 活动 按 其 结束 时 间 单 调 递增 进行 了 排序 ， 排 序 的 时 间 复 杂 度 为 O(nlgn)。 下 面 
给 出 解决 活动 选择 问题 的 贪心 算法 的 递归 形式 和 迭代 形式 。 

递归 贪心 算法 : 

int OptimalSubset[100]; 

/# 递 归 贪心 算法 所/ 

int RecursiveActivitySelector(int* s,int *fint index,int n){ /*s[0] 和 ff0] 为 0, 活动 开始 时 间 和 结束 时 间 从 

下 标 1 开始 存储 */ 


int m= index + 1; 
static int activity_number = 0 


while(m <= n && s[m] <= ffindex]) 记 寻 找 开 始 时 间 晚 于 index 结束 的 活动 */ 
ID+ 十 ; 

ifm <=D){ 
OptimalSubset[activity_ number++] = m; 上 * 选 择 找到 的 活动 */ 
RecursiveActivitySelector(s,f,m,n); /# 以 活动 mm 的 结束 时 间 为 基准 继续 寻找 */ 

} 

else 


return activity_number: 
} 


友 代 贪心 算法 : 


int GreedyActivitySelector(int *s,int *fintn){f 
int activity_ number = 0; 
OptimalSubset[activity_ number++] = 1; 证 选择 活动 1*/ 
int index = 1; 
int m; 
for(m=2:m < 一 D2m++){ 


ifs[m] >= findex]){ /# 寻 找 开 始 时 间 晚 于 index 结束 的 活动 */ 
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OptimalSubset[activity_ number++] = m: ”/* 选 择 找到 的 活动 */ 
index = m:; 庆 继 续 寻 找 所 
} 
} 


Teturn activity_number; 


} 


根据 分 析 ， 递 归 贪 心算 法 和 迭代 贪心 算法 都 能 在 O(n) 的 时 间 复 杂 度 内 完成 。 

【 例 8.12】 背包 问题 。 

背包 问题 的 定义 与 0-1 背包 问题 类 似 ， 但 是 每 个 物品 可 以 部 分 装 入 背包 ， 即 在 0-1 背包 问 
题 中 ，x=0 或 者 x 二 1; 而 在 背包 问题 中 ，0 <xi< 1。 

为 了 更 好 地 分 析 该 问题 ， 考 虑 一 个 例子 : n=5，W=100， 表 8-4 给 出 了 各 个 物品 的 重量 、 价 
值 和 单位 重量 的 价值 。 假 设 物品 已 经 按 其 单位 重量 的 价值 从 大 到 小 排 好 序 。 


表 8-4 物品 的 基本 信息 


物品 i 5 
Ww; 40 
40 
Vi/W; 1 


为 了 得 到 最 优 解 ， 必 须 把 背包 放 满 。 现 在 用 贪心 策略 求解 ， 首 先 要 选 出 度量 的 标准 。 

(1) 按 最 大 价值 先 放 背包 的 原则 。 

此 时 ， 先 放 物 品 1 和 4， 获 得 价值 65+60=125， 背 包 还 剩 容量 100-30-50=20， 此 时 物品 5 
是 价值 最 大 的 ， 但 其 重量 为 40， 不 能 全 部 放 入 背包 。 而 且 一 般 将 物品 2 和 3 放 入 背包 比 把 物品 
5 的 一 半 放 入 背包 能 获得 更 大 的 价值 。 因 此 把 物品 2 放 入 背包 ， 得 到 价值 125+20=145， 剩 余 容 
量 20-10=10。 此 时 可 再 放 入 物品 3 的 13， 得 到 总 价值 145+1.5X10=160， 对 应 的 解 为 {1，1， 
EX 

(2) 按 最 小 重量 先 放 背 包 的 原则 。 

此 时 ， 将 物品 2、3、1 和 5 放 入 背包 中 ， 刚 好 装 满 ， 得 到 价值 20+30+65+40=155， 对 应 的 
和 解 为 {1 0 地 

(3) 按 最 大 单位 重量 价值 先 放 背包 的 原则 。 

此 时 , 将 物品 1、2 和 3 放 入 背包 中 , 得 到 价值 65+20+30=115, 剩余 容量 100-30-10-20=40。 
此 时 可 再 放 入 物品 4 的 4/5， 得 到 总 价值 115+4/5X60=163， 对 应 的 解 为 {1，1，1，4/5，0}。 可 
以 证 明 ， 该 解 为 问题 的 最 优 解 ， 因 此 用 贪心 法 求解 背包 问题 ， 应 根据 该 原则 来 放置 物品 。 

假设 对 ”个 物品 按 其 单位 重量 价值 从 大 到 小 进行 了 排序 ， 排 序 的 时 间 复 杂 度 为 O(nlgn)。 
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下 面 给 出 用 贪心 法 解决 背包 问题 的 C 代码 。 


int * GreedyKnapsack(int nint Wint* Weights,float* Values,float *VW){ 


} 


int i; 
记分 配 空间 及 初始 化 */ 
float* x = (float*)malloc(sizeof(float)*n); 
for(i= 0;i<n;it+) 
x[] =0; 
for(i= 0;i<n;it+) 
if(Weights[i] <= W){ 刻 如 果 背 包 剩 余 容 量 可 以 装 下 该 物品 */ 
x[i]=1; 
W=W -Weights[il: 
} 
else 
break:; 
ifi<m{ 此 如 果 还 有 物品 可 以 部 分 装 入 背包 中 */ 
x[i] = W / (float)Weights[i]; 
} 


Teturn x; 


8.6 回溯 法 


回溯 法 有 “通用 的 解 题 法 ”之 称 ， 用 它 可 以 系统 地 搜索 一 个 问题 的 所 有 解 或 任 一 解 。 回 济 


法 是 一 个 既 带 有 系统 性 又 带 有 跳跃 性 的 搜索 算法 。 它 在 包含 问题 的 所 有 解 的 解 空间 树 中 ， 按 照 


深度 优先 的 策略 ， 从 根 结 点 出 发 搜索 解 空间 树 。 算 法 搜索 至 解 空间 树 的 任 一 结 点 时 ， 总 是 先 判 


断 该 结 点 是 否 肯 定 不 包含 问题 的 解 。 如 果 肯 定 不 包含 ， 则 跳 过 对 以 该 结 点 为 根 的 子 树 的 系统 搜 


索 ， 逐 层 向 其 祖先 结 点 回溯 否则， 进入 该 子 树 ， 继 续 按 深 度 优先 的 策略 进行 搜索 。 回 济 法 在 


用 来 求 问题 的 所 有 解 时 要 回溯 到 根 ， 且 根 结 点 的 所 有 子 树 都 已 被 搜索 遍 才 结束 ;而 用 来 求 问 题 


的 任 一 解 时 ， 只 要 搜索 到 问题 的 一 个 解 就 可 以 结束 。 这 种 以 深度 优先 的 方式 系统 地 搜索 问题 的 
解 的 方法 称 为 回溯 法 ， 它 适用 于 解 一 些 组 合 数 较 大 的 问题 。 


8.6.1 


回溯 法 的 算法 框架 


1. 问题 的 解 空间 


在 应 用 回溯 法 解 问题 时 ， 首 先 应 明确 定义 问题 的 解 空 间 。 问 题 的 解 空间 应 至 少 包含 问题 的 
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一 个 〈 最 优 ) 解 。 例 如 ， 对 于 有 n 种 可 选择 物品 的 0-1 背包 问题 ， 其 解 空间 由 长 度 为 n 的 0-1 
向 量 组 成 。 该 解 空间 包含 了 对 变量 的 所 有 可 能 的 0-1 赋值 。 当 w=3 时 ,其 解 空 间 是 {(0,0,0), (0.1.0)， 
(0,0,1), (1,0,0), (0,1,1), (1,0,1),(1,1,0),(1,1,D)}.。 

定义 了 问题 的 解 空间 后 ， 还 应 将 解 空间 很 好 地 组 织 起 来 ， 使 得 用 回溯 法 能 方便 地 搜索 整个 
解 空间 。 通 常 将 解 空间 表示 为 树 或 图 的 形式 。 例 如 ， 对 于 n=3 时 的 0-1 背包 问题 ， 其 解 空间 用 
一 棵 完全 二 叉 树 表示 ， 如 图 8-4 所 示 。 


XI)=1 


图 8-4 0-1 背包 问题 的 解 空间 树 


解 空间 树 的 第 i 层 到 第 寺 1 层 边 上 的 标号 给 出 了 变量 的 值 。 从 树 根 到 叶子 的 任 一 路 径 表 示 
解 空间 的 一 个 元 素 。 例 如 ， 从 根 结 点 到 结 点 五 的 路 径 对 应 于 解 空间 中 的 元 素 (1,1,1)。 


2. 回溯 法 的 基本 思想 


在 确定 了 解 空间 的 组 织 结构 后 ， 回 渊 法 从 开始 结 点 〈 根 结 点 ) 出发， 以 深度 优先 的 方式 搜 
索 整 个 解 空间 。 这 个 开始 结 点 就 成 为 一 个 活 结 点 ， 同 时 也 成 为 当前 的 扩展 结 点 。 在 当前 的 扩展 
结 点 处 ， 搜 索 向 纵深 方向 移 至 一 个 新 结 点 。 这 个 新 结 点 就 成 为 一 个 新 的 活 结 点 ， 并 成 为 当前 扩 
展 结 点 。 如 果 在 当前 扩展 结 点 处 不 能 再 向 纵深 方向 移动 ， 则 当前 的 扩展 结 点 就 成 为 死结 点 。 换 
句 话 说， 这 个 结 点 不 再 是 一 个 活 结 点 。 此 时 ， 应 往 回 移动 〈 回 溯 ) 至 最 近 的 一 个 活 结 点 处 ， 并 
使 这 个 活 结 点 成 为 当前 的 扩展 结 点 。 回 淹 法 即 以 这 种 工作 方式 递归 地 在 解 空间 中 搜索 ， 直 到 找 
到 所 要 求 的 解 或 解 空间 中 已 无 活 结 点 时 为 止 。 

例如 ， 对 于 n=3 时 的 0-1 背包 问题 ， 考 虑 下 面 的 具体 实例 : w=[16,15,15]，p=[45.25,25]， 
c=30。 其 中 ，w 表示 物品 的 重量 ，P 表示 物品 的 价值 ，c 表示 背包 能 够 容纳 的 最 大 重量 。 从 图 
8-4 的 根 结 点 开始 搜索 其 解 空间 。 
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(1) 开始 时 根 结 点 是 唯一 的 活 结 点 ， 也 是 当前 的 扩展 结 点 。 在 这 个 扩展 结 点 处 ， 按 照 深度 
优先 策略 移 至 结 点 B 或 结 点 C。 假 设 选择 先 移 至 结 点 B， 此 时 结 点 A 和 结 点 了 B 是 活 结 点 ， 结 点 
B 成 为 当前 的 扩展 结 点 。 由 于 选取 了 w 〈 结 点 A 到 了 的 边 上 标记 为 1， 表 示 选 择 物 品 )， 故 在 
结 点 B 处 剩余 背包 容量 是 一 14， 获 取 的 价值 是 45。 

(2) 从 结 点 B 处 可 以 移 至 结 点 D 或 下 。 由 于 移 至 结 点 D 需要 w=15 的 背包 容量 ， 而 现在 
的 背包 容量 是 一 14， 故 移 至 结 点 D 导致 一 个 不 可 行 的 解 。 而 搜索 至 结 点 E 不 需要 占用 背包 容 
量 ( 结 点 B 到 结 点 E 的 边 上 标记 为 0， 表 示 不 需要 选择 物品 )， 因 此 是 可 行 的 。 从 而 选择 移 至 
结 点 E， 此 时 卫 成 为 新 的 扩展 结 点 ， 结 点 A、B 和 玉 是 活 结 点 。 在 结 点 E 处 ， :=14， 获 取 的 价 
值 为 45。 

(3) 从 结 点 卫 处 可 以 移 至 结 点 J 或 有 K。 移 至 结 点 J 导致 一 个 不 可 行 解 ， 而 移 至 结 点 K 是 可 
行 的 ， 于 是 移 至 结 点 K， 它 成 为 一 个 新 的 扩展 结 点 。 由 于 结 点 K 是 一 个 叶子 结 点 ， 故 得 到 一 个 
可 行 解 ， 这 个 解 对 应 的 价值 为 45。 解 x 的 取 值 是 由 根 结 点 到 叶子 结 点 K 的 路 径 唯 一 确定 的 ， 即 
2 三 1,0,0)。 由 于 在 结 点 K 处 已 不 能 再 向 纵深 扩展 ， 所 以 结 点 K 成 为 死结 点 。 返 回 到 结 点 E， 
此 时 在 EE 处 也 没有 可 扩展 的 结 点 ， 它 也 成 为 一 个 死结 点 。 

(4) 返回 结 点 B 处 ， 结 点 B 同样 成 为 死结 点 ， 从 而 结 点 A 再 次 成 为 当前 扩展 结 点 。 结 点 
A 还 可 以 继续 扩展 ， 从 而 达到 结 点 C。 此 时 一 30， 获 取 的 价值 为 0。 

(5) 从 结 点 C 可 移 至 结 点 或 G。 假 设 移 至 结 点 F， 它 成 为 新 的 扩展 结 点 。 结 点 A、C 和 
F 是 活 结 点 。 在 结 点 F 处 ， 一 15， 获 取 的 价值 为 23。 从 结 点 下 移 至 结 点 工 处 ， 此 时 r=0， 获 取 
的 价值 为 30。 由 于 工 是 一 个 叶子 结 点 ， 而 且 是 迄今 为 止 找到 的 获取 价值 最 高 的 可 行 解 ,因此 记 
录 这 个 可 行 解 。 结 点 工 不 可 扩展 ， 返 回 到 结 点 F 处 。 

按 此 方式 继续 搜索 ， 可 搜索 整个 解 空间 。 搜 索 结束 后 找到 的 最 好 解 就 是 0-1 背包 问题 的 最 
优 解 。 

综 上 所 述 ， 运 用 回 济 法 解 题 通常 包含 以 下 3 个 步骤 。 

(1) 针对 所 给 问题 ， 定 义 问 题 的 解 空间 。 

(2) 确定 易于 搜索 的 解 空间 结构 。 

(3) 以 深度 优先 的 方式 搜索 解 空间 。 


3。. 回溯 法 的 算法 框架 
回溯 法 的 算法 框架 有 非 递 归 和 递归 两 种 方式 。 
非 递归 方式 : 


BackTracking(X) 
1 计算 解 和 的 第 一 个 元 素 的 候选 集合 S 
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2 
3 whilek> 0 do 
4 whileSe 和 关 中 do 
xX 一 Se 中 的 下 一 个 元 素 


6 Sk 一 Se- 人 se 

2 这 义 = {X1,X2,…,X&} 是 问题 的 解 

8 then 输出 X 

9 | 

10 计算 解 和 的 第 上 个 元 素 的 候选 集合 Sk 
11 k—k-l 

12 return 

递归 方式 : 

BackTrackingDFS(X,k) 

1 这 X = (x1,x2,…,xD) 是 问题 的 解 

2 ”then 输出 XX 

3 elsek 一 +1 

4 计算 解 和 的 第 k 个 元 素 的 候选 集合 Sk 
5 while Se A 中 do 

6 一 一 Sc 中 的 下 一 个 元 素 

有 Sk 一 Sx— {xx} 

8 BackTrackingDFS(X.,k) 

9 return 


4. 回溯 法 的 限界 函数 


问题 的 解 空 间 往往 很 大 , 为 了 有 效 地 进行 搜索 , 需要 在 搜索 的 过 程 中 对 某 些 结 点 进行 剪 枝 ， 
而 对 哪些 结 点 进行 剪 枝 ， 需 要 设计 限界 函数 来 判断 。 因 此 ， 限 界 函数 的 设计 是 回溯 法 的 一 个 核 
心 问 题 ， 也 是 一 个 很 难 的 问题 。 设 计 限 界 函 数 的 通用 的 指导 原则 是 尽 可 能 多 和 尽 可 能 早 地 “ 杀 
掉 ” 不 可 能 产生 最 优 解 的 活 结 点 。 好 的 限界 函数 可 以 大 大 减少 问题 的 搜索 空间 ， 从 而 大 大 提高 
算法 的 效率 。 下 面 通过 例子 来 说 明 。 
8.6.2 ”回溯 法 的 典型 实例 

【 例 8.13】 0-1 背包 问题 。 

0-1 背包 问题 的 定义 如 例 8.9 所 示 。 


图 8-4 给 出 了 0-1 背包 问题 的 一 个 解 空间 树 的 示例 。 在 该 问题 中 ， 目 标 是 为 了 得 到 最 大 的 
价值 ， 因 此 可 以 “ 杀 掉 ”那些 不 可 能 产生 最 大 价值 的 活 结 点 。 那 么 ， 如 何 判断 哪些 结 点 扩展 后 
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不 可 能 产生 最 大 价值 呢 ? 考虑 贪心 策略 ， 先 对 所 有 物品 按 其 单位 重量 价值 从 大 到 小 排序 ， 对 搜 
索 空间 树 中 的 某 个 结 点 ， 如 FE， 已 经 确定 了 某 些 KR))，1<i<k， 而 其 他 的 闷 D， 有 +1<i<n 待定 。 
此 时 可 以 将 0-1 背包 问题 松弛 为 背包 问题 ， 求 从 下 结 点 扩展 下 去 ， 计 算 能 获得 的 最 大 价值 。 若 
该 价值 比 当前 已 经 得 到 的 某 个 可 行 解 的 值 要 小 ， 则 该 结 点 不 必 再 扩展 。 
若 所 有 物品 已 经 按 其 单位 重量 价值 从 大 到 小 排序 。 假 设 前 大 (包含 如 个 物品 是 否 放 入 背 
包 已 经 确定 ， 现 在 考虑 在 当前 背包 的 剩余 容量 下 ， 若 是 背包 问题 ， 那 么 能 获得 的 最 大 价值 是 多 
少 ? 即 求 背包 中 物品 的 价值 上 界 。C 代码 如 下 : 
float Bound(float *Values,int* Weights,float * VW,int n,int W,float Profit Gained,int Weight Used,int k){ 
/*Profit_Gained、Weight_Used、 分 别 为 当前 已 经 获得 的 价值 、 背 包 的 重量 、 已 经 确定 的 物品 */ 
inti; 
fori=k+ 1;i<nitt){ 
if(Weight_ Used+Weights [i] <= W){ 
Profit_Gained += Values[i]; 
Weight_ Used += Weights[j]: 


} 

else{ 
Profit_ Gained += VW[i]*(W - Weight_Used); 
Weight Used = W: 
return Profit Gained: 

} 


} 

return Profit_Gained; 
; 
int * Knapsack(float *Values,int* Weights,float * VW,int n,int W){ 
/*Values 为 物品 的 价值 数组 ，Weights 为 物品 的 重量 数组 ，VW 为 物品 Values/Weights 的 数组 ，W 为 

背包 的 最 大 容量 */ 

int current_ weight = 0; 

float current_profit = 0; 

int Weight = 0; 

float Profit = -1: 

int index = 0; 

作为 数组 X、Y 分 配 空间 */ 

int* X = (int*)malloc(sizeof(int)*n): 

int* Y = int*)malloc(sizeof(int)*n): 

while(1){ 

while(index <n && current weight + Weights[index] <= W){ 
current profit += Values[index]:; 
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current_ weight += Weights[index]; 
Ylindex] = 1: 
index++: 
iflindex >= n){ 
Weight = current weight: 
Profit = current_profit; 
index =1; 
int i; 
for(i= 0;i1<n:it+) 
XI = Y[]; 
} 
else 
Y[index] = 0; 
while (Bound(Values, Weights,V W,n,W,current_profit,current_ weight,index) <= Profit){ 
while(index != 0 && Y[index] != 1){ // 向 前 回 漳 
index--; 
} 
iflindex 一 0){ /输出 结果 
Tetum X; 
} 
Y[index] = 0; 
current profit -= Values[index]: 
current Weight -= Weights[index]: 


index++; 


其 中 ， 政 1、Weights、Values、Weight、Profit 和 碟 分 别 表示 背包 的 总 容量 、 物 品 个 数 、 重 量 
数组 、 价 值 数组 、 获 得 最 大 价值 时 背包 的 重量 、 背 包 获得 的 最 大 价值 和 问题 的 最 优 解 。 
假设 n=8，W=110， 物 品 的 价值 和 重量 如 表 8-5 所 示 。 


表 8-5 ”物品 的 基本 信息 


65 
55 


则 根据 上 述 C 代码 得 到 如 图 8-5 所 示 的 搜索 空间 树 。 
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图 8-5 0-1 背包 问题 的 回溯 法 示例 


图 8-5 所 示 树 中 的 结 点 内 若 有 数据 ， 则 上 面 表示 背包 当前 的 重量 ， 下 面 表示 背包 当前 的 价 
值 ， 结 点 内 若 无 数据 ， 则 旁边 的 数据 表示 在 现 有 的 选择 下 背包 能 获得 的 价值 的 上 界 。X(i)=1 和 
XUi)=0 分 别 表示 第 i 个 物品 放 入 和 不 放 入 背包 中 。 浅 灰色 结 点 表示 对 应 可 行 解 的 值 , 根据 图 8-5， 
存在 5 个 可 行 解 ， 其 值 分 别 为 139、149、151、96、159， 对 应 的 解 分 别 为 页 =(1,1,1,1,1,0,0.0)、 
=(1,1,1,1,0,1,0,0)、 玉 =(1,1,1,1,0,0,1,0)、 有 =(1,1,1,1,0,0,0,0)、 玉 =(1,1,1,0,1,1,0,0)。 其 中 ,五 为 
最 优 解 ， 其 值 为 159。 

【 例 8.14】n 皇后 问题 。 

这 是 来 源 于 国际 象棋 的 一 个 问题 。n 皇后 问题 要 求 在 一 个 zXz 格 的 棋盘 上 放置 个 皇后 ， 
使 得 它们 彼此 不 受 攻击 。 按 照 国 际 象棋 的 规则 ， 一 个 皇后 可 以 攻击 与 之 处 在 同一 行 或 同一 列 或 
同一 条 斜 线 上 的 其 他 任何 棋子 。 因 此 , n 皇后 问题 等 价 于 要 求 在 一 个 nXn 格 的 棋盘 上 放 团 了 个 
皇后 ， 使 得 任何 两 个 皇后 不 能 被 放 在 同一 行 或 同一 列 或 同一 条 斜 线 上 。 

求解 过 程 从 空 棋盘 开始 , 设 在 第 1 行 至 第 m 行 都 已 经 正确 地 放置 了 m 个 皇后 , 再 在 第 m+1 
行 上 找 合适 的 位 置 放 第 m+1l 个 皇后 ,直到 在 第 n 行 也 找到 合适 的 位 置 放 置 第 n 个 皇后 ,就 找到 
了 一 个 解 。 接 着 改变 第 n 行 上 皇后 的 位 置 ， 希 望 获得 下 一 个 解 。 另 外 ， 在 任 一 行 上 有 种 可 选 
的 位 置 。 开 始 时 ， 位 置 在 第 1 列 ， 以 后 改变 时 ， 顺 次 选择 第 2 列 、 第 3 列 、…、 第 n 列 。 当 第 
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n 列 也 不 是 一 个 合理 的 位 置 时 ， 就 要 回溯 ， 去 改变 前 一 行 的 位 置 。 图 8-6 给 出 了 回溯 法 求解 
和 皇后 问题 的 搜索 过 程 。 


Q Q Q Q Q 
x x Q x Q Q Q 
区 交 小 直 
(a) (b) (ce) (d) Ce) 
Q Q Q Q Q 
Q x|x*|*|Q Q Q 
x |Q Q Q 
x x x 党 x Q 
(f) (g) Ch) i) (j) 


图 8-6 ”回溯 法 求解 4 皇后 问题 的 搜索 过 程 


n 皇后 问题 的 限界 函数 可 以 根据 问题 的 定义 直接 设计 ， 即 任意 两 个 皇后 不 在 同行 、 同 列 和 
同一 斜 线 上 ，C 代码 如 下 。 


int Place(int *Column,int index){ 
int i; 
for(i= 1;i< index:i++){ 
int Column differ = abs(Column[index] - Column[i]); 
int Row _differ = abs(index - D: 
if(Column[i] == Column[index] || Column differ 一 Row _diffeD) 
人/# 有 星 后 与 其 在 同 列 或 同一 斜 线 上 所 
return 0; 
} 
retum 1; 刻 没 有 皇后 与 其 同行 、 同 列 或 同 对 角 线 */ 
} 
void N_Queue(int n){ 
int Column Num[n + 1]; 
int index = 1; 
int i; 
int answer num = 0; 
ford = 1:1<=n:1t+) 
Column Numl[i] = 0: 
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while(index > 0){ 
Column Num[index]++; 
while(Column Num[index] <=n && !Place(Column Num,index)) 。 /*# 寻 找 皇 后 的 位 置 #/ 
Column Num[index]++; 
这 Column Num[index] <=D){ 
iindex 一 D){ * 最 后 一 个 皇后 放置 成 功 */ 
answer numtt+; 
forli= 1;1<= Dii++H) 
Column Num[index]++; 


else{ ”人 * 继 续 寻 找 下 一 个 皇后 的 位 置 */ 
index++; 
Column Num[index] = 0; 
3 
} 
else 


index--; 信 当 前 皇后 无 法 放置 ， 回 溯 至 上 一 个 皇后 */ 
} 


8.7 ”分 支 限界 法 


分 支 限 界 法 类 似 于 回溯 法 ， 也 是 一 种 在 问题 的 解 空 间 树 了 上 搜索 问题 解 的 算法 。 但 在 一 般 
情况 下 ， 分 支 限界 法 与 回溯 法 的 求解 目标 不 同 。 回 济 法 的 求解 目标 是 找 出 了 中 满足 约束 条 件 的 
所 有 解 ， 而 分 支 限界 法 的 求解 目标 是 找 出 满足 约束 条 件 的 一 个 解 ， 或 是 在 满足 约束 条 件 的 解 中 
找 出 使 某 一 目标 函数 值 达到 极 大 或 极 小 的 解 ， 即 在 某 种 意义 下 的 最 优 解 。 

由 于 求解 目标 不 同 ， 导 致 分 支 限界 法 与 回溯 法 在 解 空间 树 了 上 的 搜索 方式 也 不 相同 。 回 湖 
法 以 深度 优先 的 方式 搜索 解 空间 树 T7， 而 分 支 限界 法 以 广度 优先 或 以 最 小 耗费 优先 的 方式 搜索 
解 空间 树 T7。 分 支 限 界 法 的 搜索 策略 是 每 一 个 活 结 点 只 有 一 次 机 会 成 为 扩展 结 点 。 活 结 点 一 旦 
成 为 扩展 结 点 ， 就 一 次 性 产生 其 所 有 儿子 结 点 。 在 这 些 儿子 结 点 中 ， 那 些 导致 不 可 行 解 或 非 最 
优 解 的 儿子 结 点 被 舍弃 ， 其 余 儿 子 结 点 被 加 入 活 结 点 表 中 。 此 后 ， 从 活 结 点 表 中 取 下 一 结 点 成 
为 当前 扩展 结 点 ， 并 重复 上 述 结 点 扩展 过 程 。 这 个 过 程 一 直 持 续 到 找到 所 需 的 解 或 活 结 点 表 为 
室 时 为 止 。 人 们 已 经 利用 分 支 限界 法 解决 了 大 量 离散 最 优化 的 实际 问题 。 

与 回溯 法 相似 ， 限 界 函 数 的 设计 是 分 支 限界 法 的 一 个 核心 问题 ， 也 是 一 个 很 难 的 问题 。 如 
何 设计 限界 函数 来 有 效 地 减 小 搜索 空间 是 应 用 分 支 限界 法 要 考虑 的 问题 。 
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根据 从 活 结 点 表 中 选择 下 一 扩展 结 点 的 不 同方 式 ， 可 将 分 支 限 界 法 分 为 几 种 不 同 的 类 型 。 
最 常用 的 有 以 下 两 种 。 

(1) 队列 式 (FIFO， 先 进 先 出 ) 分 支 限 界 法 。 队 列 式 分 支 限 界 法 将 活 结 点 表 组 织 成 一 个 队 
列 ， 并 按 队 列 的 先进 先 出 原则 选择 下 一 个 结 点 作为 扩展 结 点 。 

(2) 优先 队列 式 分 支 限界 法 。 优 先 队 列 式 分 支 限界 法 将 活 结 点 表 组 织 成 一 个 优先 队列 ， 并 
按 优 先 队 列 中 规定 的 结 点 优先 级 选取 优先 级 最 高 的 下 一 个 结 点 作为 扩展 结 点 。 

优先 队列 中 规定 的 结 点 优先 级 通常 用 一 个 与 该 结 点 相关 的 数值 p 来 表示 。 结 点 优先 级 的 高 
低 与 p 值 的 大 小 相关 。 最 大 优先 队列 规定 p 值 较 大 的 结 点 优先 级 较 高 。 在 算法 实现 时 ， 通 常用 
一 个 最 大 堆 来 实现 最 大 优先 队列 ， 用 最 大 堆 的 Deletemax 操作 抽取 堆 中 下 一 个 结 点 成 为 当前 扩 
展 结 点 。 类 似 地 ， 最 小 优先 队列 规定 p 值 较 小 的 结 点 优先 级 较 高 。 在 算法 实现 时 ， 常 用 一 个 最 
小 堆 来 实现 最 小 优先 队列 , 用 最 小 堆 的 Deletemin 操作 抽取 堆 中 下 一 个 结 点 成 为 当前 扩展 结 点 。 

例如 ,n=3 时 0-1 背包 问题 的 一 个 实例 : w=[16,15,15]，p=[45,25,25]，c=30， 其 解 空间 树 如 
图 8-4 所 示 。 

用 队列 式 分 支 限 界 法 解 此 问题 时 ， 用 一 个 队列 来 存储 活 结 点 表 。 算 法 从 根 结 点 A 出 发 。 

(1) 初始 时 活 结 点 队列 为 空 。 

(2) 结 点 A 是 当前 扩展 结 点 ， 它 的 两 个 儿子 结 点 B 和 C 均 为 可 行 结 点 ， 故 将 这 两 个 儿子 
结 点 按照 从 左 到 右 的 顺序 加 入 活 结 点 队列 ， 并 且 舍弃 当前 扩展 结 点 A。 

(3) 按照 先进 先 出 的 原则 ， 下 一 个 扩展 结 点 是 活 结 点 队列 的 队 首 结 点 B。 扩 展 结 点 B 得 到 
其 儿子 结 点 D 和 E。 由 于 DD 是 不 可 行 结 点 ， 故 被 舍 去 。E 是 可 行 结 点 ， 被 加 入 活 结 点 队列 。 此 
时 活 结 点 队列 中 的 元 素 是 C 和 下 。 

(4) C 成 为 当前 扩展 结 点 ， 它 的 两 个 儿子 结 点 FE 和 G 均 为 可 行 结 点 ， 因 此 被 加 入 活 结 点 队 
列 。 此 时 活 结 点 队列 中 的 元 素 是 E、F、G。 

(5) 扩展 下 一 个 结 点 E， 得 到 结 点 J 和 KK。J 是 不 可 行 结 点 ， 因 而 被 舍 去 。K 是 一 个 可 行 
的 叶子 结 点 ， 表 示 所 求 问题 的 一 个 可 行 解 ， 其 价值 为 44。 此 时 活 结 点 队列 中 的 元 素 是 F 和 G。 

(6) 当前 活 结 点 队列 的 队 首 结 点 下 成 为 下 一 个 扩展 结 点 。 它 的 两 个 儿子 结 点 工 和 M 均 为 
叶子 结 点 。 工 表示 获得 价值 为 50 的 可 行 解 ，M 表示 获得 价值 为 25 的 可 行 解 。 

(7) G 是 最 后 一 个 扩展 结 点 ， 其 儿子 结 点 N 和 O 均 为 可 行 叶子 结 点 。 最 后 活 结 点 队列 为 
空 ， 算 法 终止 。 算 法 搜索 得 到 最 优 解 的 值 为 50， 对 应 的 解 为 (0,1,1)。 


8.8 概率 算法 


前 面 讨论 的 算法 对 于 所 有 合理 的 输入 都 给 出 正确 的 输出 ， 概 率 算法 将 这 一 条 件 放宽 ， 把 随 
机 性 的 选择 加 入 到 算法 中 。 在 算法 执行 某 些 步骤 时 ， 可 以 随机 地 选择 下 一 步 该 如 何 进行 ， 同 时 
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允许 结果 以 较 小 的 概率 出 现 错误 ， 并 以 此 为 代价 ， 获 得 算法 运行 时 间 的 大 幅度 减少 。 概 率 算法 
的 一 个 基本 特征 是 对 所 求解 问题 的 同一 实例 用 同一 概率 算法 求解 两 次 ， 可 能 得 到 完全 不 同 的 效 
果 。 这 两 次 求解 所 需 的 时 间 甚 至 所 得 到 的 结果 可 能 会 有 相当 大 的 差别 。 如 果 一 个 问题 没有 有 效 
的 确定 性 算法 可 以 在 一 个 合理 的 时 间 内 给 出 解 ， 但 是 该 问题 能 接受 小 概率 错误 ， 那 么 采用 概率 
算法 就 可 以 快速 找到 这 个 问题 的 解 。 

一 般 情 况 下 ， 概 率 算法 具有 以 下 基本 特征 。 

(1) 概率 算法 的 输入 包括 两 部 分 ， 一 部 分 是 原 问题 的 输入 ， 另 一 部 分 是 一 个 供 算法 进行 随 
机 选择 的 随机 数 序列 。 

(2) 概率 算法 在 运行 过 程 中 ， 包 括 一 处 或 多 处 随机 选择 ， 根 据 随机 值 来 决定 算法 的 运行 
路 径 。 

(3) 概率 算法 的 结果 不 能 保证 一 定 是 正确 的 ， 但 能 限制 其 出 错 概率 。 

(4) 概率 算法 在 不 同 的 运行 过 程 中 ， 对 于 相同 的 输入 实例 可 以 有 不 同 的 结果 ， 因 此 ， 对 于 
相同 的 输入 实例 ， 概 率 算法 的 执行 时 间 可 能 不 同 。 

概率 算法 大 致 分 为 4 类 : 数值 概率 算法 、 蒙 特 卡 罗 (Monte Carlo) 算法 、 拉 斯 维 加 斯 (Las 
Vegas) 算法 和 舍 伍 德 (Sherwood) 算法 。 

(1) 数值 概率 算法 。 数值 概率 算法 常用 于 数值 问题 的 求解 。 这 类 算法 得 到 的 往往 是 近似 解 ， 
且 近 似 解 的 精度 随 计 算 时 间 的 增加 不 断 提 高 。 在 多 数 情况 下 ， 要 计算 出 问题 的 精确 解 是 不 可 能 
的 或 者 是 没有 必要 的 ， 因 此 用 数值 概率 算法 可 得 到 相当 满意 的 解 。 

(2) 蒙特 卡 罗 算 法 。 蒙 特 卡 罗 算 法 用 于 求 问题 的 精确 解 。 用 蒙特 卡 罗 算 法 能 求 得 问题 的 一 
个 解 ， 但 这 个 解 未 必 是 正确 的 。 求 得 正确 解 的 概率 依赖 于 算法 所 用 的 时 间 ， 算 法 所 用 的 时 间 越 
多 ， 得 到 正确 解 的 概率 就 越 高 。 蒙 特 卡 罗 算 法 的 主要 缺点 也 在 于 此 ， 一 般 情 况 下 ， 无 法 有 效 地 
判定 所 得 到 的 解 是 否 肯定 正确 。 

(3) 拉 斯 维 加 斯 算法 。 拉 斯 维 加 斯 算法 不 会 得 到 不 正确 的 解 。 一 旦 用 拉 斯 维 加 斯 算法 找到 
一 个 解 ， 这 个 解 就 一 定 是 正确 解 。 拉 斯 维 加 斯 算法 找到 正确 解 的 概率 随 它 所 用 的 计算 时 间 的 增 
加 而 提高 。 对 于 所 求解 问题 的 任 一 实例 ， 用 同一 拉 斯 维 加 斯 算法 反复 对 该 实例 求解 足够 多 次 ， 
可 使 求解 失效 的 概率 任意 小 。 

(4) 舍 伍 德 算法 。 舍 伍德 算法 总 能 求 得 问题 的 一 个 解 ， 且 所 求 得 的 解 总 是 正确 的 。 当 一 个 
确定 性 算法 在 最 坏 情况 下 的 计算 复杂 度 与 其 在 平均 情况 下 的 计算 复杂 度 有 较 大 差别 时 ， 可 在 这 
个 确定 性 算法 中 引入 随机 性 将 它 改 造成 一 个 舍 伍 德 算法 ， 消 除 或 减少 问题 的 好 坏 实例 间 的 这 种 
差别 。 舍 伍德 算法 的 精髓 不 是 避免 算法 的 最 坏 情 况 行为 ， 而 是 设法 消除 这 种 最 坏 情 形 行为 与 特 
定 实 例 之 间 的 关联 性 。 
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8.9 近似 算法 


迄今 为 止 ， 所 有 的 难 解 问题 都 没有 多 项 式 时 间 算 法 ， 采 用 回溯 法 和 分 支 限界 法 等 算法 设计 
技术 可 以 相对 有 效 地 解决 这 类 问题 。 然 而 ， 这 些 算法 的 时 间 性 能 常常 是 无 法 保证 的 。 近 似 算法 
是 解决 难 解 问题 的 一 种 有 效 策 略 ， 其 基本 思想 是 放弃 求 最 优 解 ， 而 用 近似 最 优 解 代替 最 优 解 ， 
以 换取 算法 设计 上 的 简化 和 时 间 复 杂 度 的 降低 。 近 似 算法 是 这 样 一 个 过 程 : 虽然 它 可 能 找 不 到 
一 个 最 优 解 ， 但 它 总 会 给 待 求解 的 问题 提供 一 个 解 。 为 了 具有 实用 性 ， 近 似 算法 必须 能 够 给 出 
算法 所 产生 的 解 与 最 优 解 之 间 的 差别 或 者 比例 的 一 个 界限 ， 它 保证 任意 一 个 实例 的 近似 最 优 解 
与 最 优 解 之 间 相 差 的 程度 。 显 然 ， 这 个 差别 越 小 ， 近 似 算法 越 具 有 实用 性 。 

衡量 近似 算法 性 能 最 重要 的 标准 有 以 下 两 个 。 

(1) 算法 的 时 间 复 杂 度 。 近 似 算法 的 时 间 复 杂 度 必须 是 多 项 式 阶 的 ， 这 是 近似 算法 的 基本 
目标 。 

(2) 解 的 近似 程度 。 近 似 最 优 解 的 近似 程度 也 是 设计 近似 算法 的 重要 目标 。 近 似 程度 与 近 
似 算法 本 身 、 问 题 规模 ， 乃 至 不 同 的 输入 实例 有 关 。 


8.10 数据 挖掘 算法 


1. 数据 挖掘 概述 


在 当今 的 大 数据 时 代 ， 数 据 挖掘 、 机 器 学 习 和 人 工 智能 这 些 名 词 在 我 们 的 生活 、 工 作 和 学 
习 中 已 经 是 耳熟能详 的 词汇 。 我 们 需要 各 种 技术 来 分 析 爆 炸 式 增长 的 各 类 数据 ， 以 发 现 隐 含 在 
这 些 数据 中 的 有 价值 的 信息 和 知识 。 作 为 一 门 交叉 学 科 ， 数 据 挖掘 利用 机 器 学 习 方 法 对 多 种 数 
据 ， 包 括 数 据 库 数据 、 数 据 仓库 数据 、Web 数据 等 进行 分 析 和 挖掘 。 数 据 挖掘 的 核心 是 算法 ， 
其 主要 功能 包括 分 类 、 回 归 、 关 联 规则 和 聚 类 等 。 


2. 分 类 


分 类 是 一 种 有 监督 的 学 习 过 程 ， 根 据 历史 数据 预测 未 来 数据 的 模型 。 分 类 的 数据 对 象 属性 
分 为 两 类 , 一 般 属 性 和 分 类 属性 或 者 目标 属性 。 对 数据 分 类 有 两 个 步骤 : 学 习 模型 和 应 用 模型 ， 
在 分 类 过 程 中 ， 涉 及 到 的 数据 包括 训练 数据 集 、 测 试 数据 集 和 未 知 数据 。 学 习 模型 是 指 基于 训 
练 数据 集 采用 分 类 算法 建立 学 习 模型 。 而 应 用 模型 是 指 应 用 测试 数据 集 的 数据 到 学 习 模 型 中 ， 
根据 输出 来 评估 模型 的 好 坏 以 及 将 未 知 数据 输入 到 学 习 模型 中 ， 预 测 数据 的 类 型 。 
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存在 多 种 分 类 算法 。 决 策 树 归纳 是 一 种 自 项 向 下 的 递归 树 算法 ,使 用 一 种 属性 选择 度量 为 
树 的 每 个 非 叶子 节点 选择 待 分 裂 的 属性 。ID3、C4.5 和 CART 是 典型 的 决策 树 算法 ， 它 们 使 用 
不 同 的 属性 选择 度量 。 朴 素 贝 叶 斯 算法 和 贝 叶 斯 信念 网 络 基于 后 验 概 率 的 贝 叶 斯 公式 进行 分 
类 ， 前 者 假设 类 条 件 独立 ， 即 数据 对 象 的 各 个 属性 之 间 互 相 独立 ， 后 者 考虑 属性 之 间 的 关系 。 
后 向 传播 (BP) 算法 是 使 用 梯度 下 降 法 的 神经 网 络 方法 。 它 搜索 一 组 权重 ， 对 数据 建 模 ， 使 得 
数据 对 象 的 预测 类 型 和 实际 类 型 之 间 的 平均 平方 距离 最 小 。 支 持 向 量 机 (SVM) 是 一 种 用 于 线 
性 和 非 线性 数据 的 分 类 算法 。 它 把 输入 数据 变换 到 较 高 维 空间 , 使 用 称 作 支 持 向 量 的 基本 元 组 ， 
从 中 发 现 分 离 数 据 的 超 平面 。 

可 以 用 混淆 矩阵 来 评估 分 类 模型 的 质量 。 如 对 于 两 类 问题 ， 混淆 矩阵 给 出 真正 例 True 
了 Positive)、 真 负 例 (True Negative)、 假 正 例 〈False Positive)、 假 负 例 (False Negative)。 基 于 
这 些 量 可 以 计算 分 类 模型 的 准确 率 、 灵 敏 度 (召回 率 )、 特 效 性 、 精 度 、F 度量 等 。 可 以 用 显著 
性 检验 和 ROC 曲线 来 评价 不 同 分 类 模型 的 好 坏 。 

把 已 知 类 别 的 数据 集 分 为 训练 集 和 测试 集 时 ， 可 以 采用 保持 、 随 机 抽样 、 交 叉 检 验 和 自助 
法 。 而 可 以 将 多 个 分 类 模型 组 合 起 来 以 提高 分 类 的 质量 ， 其 中 袋 装 、 提 升 和 随机 森林 是 典型 的 
组 合 分 类 方法 。 

3， 频繁 模式 和 关联 规则 挖掘 


挖掘 海量 数据 中 的 频繁 模式 和 关联 规则 可 以 有 效 地 指导 企业 发 现 交 叉 销售 机 会 、 进 行 决策 
分 析 和 商务 管理 等 。 一 个 典型 的 应 用 是 购物 篮 分 析 ， 即 顾客 经 常 购买 的 商品 集合 ， 从 而 分 析 顾 
客 的 购买 习惯 。 而 其 中 ， 沃 尔 玛 公司 对 其 顾客 购买 数据 进行 分 析 时 ， 发 现 购买 尿布 的 客户 通常 
也 会 购买 啤酒 ， 根 据 这 一 规律 ， 他 们 在 摆 放 货架 时 ， 有 意 的 把 啤酒 和 尿布 放 到 一 起 ， 以 便 顾客 
购买 。 这 就 是 有 名 的 啤酒 尿布 故事 。 频 繁 模式 时 频繁 出 现在 数据 集中 的 模式 ， 要 求 满足 最 小 支 
持 度 阔 值 ， 如 啤酒 和 尿布 频繁 的 出 现在 同一 购物 篮 中 。 关 联 规 则 是 形 如 A>B 的 规则 ， 其 中 A 
和 了 B 表示 数据 集中 的 子 集 ， 要 求 AB 既 要 满足 最 小 支持 度 闵 值 ， 还 要 满足 最 小 置信 度 闵 值 。 如 
同时 购买 啤酒 和 尿布 的 购物 篮 满 足 最 小 支持 度 阔 值 ， 同 时 A?>B 满足 最 小 置信 度 阔 值 。 支 持 度 
和 置信 度 的 定义 如 下 : 

Support(A>B) =P(AUB) 

Confidence (A>>B) =PGBIA) 

求解 关联 规则 首先 要 求 出 数据 集中 的 频繁 模式 ， 然 后 由 频繁 模式 产生 关联 规则 。 

人 们 提出 了 多 种 关联 规则 挖掘 算法 : 类 Apriori 算法 ; 基于 频繁 模式 增长 的 方法 ， 如 
FP-growth， 使 用 垂直 数据 格式 的 算法 ， 如 ECLAT。 
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4. 聚 类 


聚 类 是 一 种 无 监督 学 习 过 程 。 根 据 数据 的 特征 ， 将 相似 的 数据 对 象 归 为 一 类 ， 不 相似 的 数 
据 对 象 归 到 不 同 的 类 中 ， 这 就 是 聚 类 ， 每 个 聚 类 也 称 为 科 。“ 物 以 类 聚 ， 人 以 群 分 ”就 是 聚 类 
的 典型 描述 。 

聚 类 的 典型 算法 有 : 基于 划分 的 方法 、 基 于 层次 的 方法 、 基 于 密度 的 方法 、 基 于 网 格 的 方 
法 和 基于 统计 模型 的 方法 。 基 于 划分 的 方法 将 n 个 数据 对 象 划分 为 个 不 相交 的 集合 ， 每 个 集 
合 称 为 一 个 艇 。 典 型 的 算法 有 大 均值 、 大 中 心 点 算法 等 。 基 于 层次 的 方法 将 数据 对 象 集 进行 层 
次 的 分 解 。 根 据 其 是 自 底 向 上 还 是 自 项 向 下 分 解 ， 可 以 分 为 凝聚 的 方法 和 分 裂 的 方法 ， 而 前 者 
的 典型 算法 是 AGNES， 后 者 的 典型 算法 是 DIANA。 基 于 密度 的 方法 基于 数据 对 象 的 邻 域 来 进 
行 聚 类 分 析 ， 因 此 可 以 识别 各 种 形状 的 驴 ， 以 及 一 个 数据 对 象 可 以 属于 多 个 不 同 的 簇 ， 
DBSCAN、OPTICS 和 DENCLUE 是 其 中 的 典型 算法 。 基 于 网 格 的 方法 把 对 象 空间 量化 为 有 限 
个 单元 ， 形 成 一 个 网 格 结构 。 所 有 的 聚 类 操作 在 该 网 格 上 进行 ，STING 和 CLIQUE 是 其 中 的 两 
个 算法 。 基 于 统计 模型 的 算法 将 数据 对 象 集 看 作 多 个 服从 不 同 分 布 的 数据 集 构成 ， 聚 类 的 目的 
是 识别 出 这 些 不 同 的 分 布 的 数据 对 象 ，EM 算法 是 其 中 的 一 个 典型 算法 。 


S.， 数据 挖掘 的 应 用 


数据 挖掘 在 多 个 领域 已 有 成 功 的 应 用 。 在 银行 和 金融 领域 ， 可 以 进行 贷款 偿还 预测 和 顾客 
信用 政策 分 析 、 针 对 定向 促销 的 顾客 分 类 与 聚 类 、 洗 黑钱 和 其 他 金融 犯罪 侦破 等 ， 在 零售 和 电 
信 业 ， 可 以 进行 促销 活动 的 效果 分 析 、 顾 客 忠诚 度 分 析 、 交 叉 销 售 分 析 、 商 品 推荐 、 欺 骗 分 
析 等 。 


8.11 智能 优化 算法 


1. 智能 优化 算法 概述 


优化 技术 是 一 种 以 数学 为 基础 ， 用 于 求解 各 种 工程 问题 优化 解 的 应 用 技术 。 作 为 一 个 重要 
的 科学 分 支 ， 它 一 直 受 到 人 们 的 广泛 重视 ， 并 在 诸多 工程 领域 得 到 迅速 推广 和 应 用 ， 如 系统 控 
制 、 人 工 智 能 、 模 式 识别 、 生 产 调度 、VLSI 技术 和 计算 机 工程 等 。 鉴 于 实际 工程 问题 的 复杂 
性 、 约 束 性 、 非 线性 、 多 极 小 、 建 模 困难 等 特点 ， 寻 求 一 种 适合 于 大 规模 并 行 且 具有 智能 特征 
的 算法 已 成 为 有 关 学 科 的 一 个 主要 研究 目标 和 引信 注目 的 研究 方向 。 20 世纪 80 年 代 以 来 , 一 
些 新 颖 的 优化 算法 ， 如 人 工 神经 网 络 、 混 沌 、 遗 传 算法 、 进 化 规划 、 模 拟 退火 、 禁 忌 搜 索 及 其 
混合 优化 策略 等 ， 通 过 模拟 或 揭示 某 些 自然 现象 或 过 程 而 得 到 发 展 ， 其 思想 和 内 容 涉及 数学 、 
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物理 学 、 生 物 进化 、 人 工 智 能 、 神 经 科学 和 统计 力学 等 方面 ， 为 解决 复杂 问题 提供 了 新 的 思路 
和 手段 。 这 些 算法 独特 的 优点 和 机 制 ， 引 起 了 国内 外 学 者 的 广泛 重视 并 掀起 了 该 领域 的 研究 热 
潮 ， 且 在 诸多 领域 得 到 了 成 功 应 用 。 在 优化 领域 ， 由 于 这 些 算法 构造 的 直观 性 与 自然 机 理 ， 因 
而 通常 被 称 作 智能 优化 算法 ， 或 称 现代 启发 式 算法 。 

2. 人 工 神经 网 络 


人 工 神经 网 络 (ANN) 是 一 个 以 有 向 图 为 拓扑 结构 的 动态 系统 , 它 通过 对 连续 或 断 续 的 输 
入 作 状 态 响 应 而 进行 信息 处 理 。 人 工 神经 网 络 技术 与 计算 机 技术 的 结合 , 为 人 类 进一步 研究 模 
拟人 类 智能 及 了 解 人 脑 思维 的 奥秘 开辟 了 一 条 新 途径 。 

人 工 神 经 网 络 是 由 许多 人 工 神经 元 按 一 定 规则 连接 构成 的 , 其 互 连 模式 有 许多 种 类 , 常见 
的 一 种 分 类 是 前 馈 网 络 和 反馈 网 络 。 其 中 ， 基 于 BP 算法 的 多 层 前 向 神经 网 络 , 成 功 地 解决 了 
多 层 神经 网 络 中 隐 含 层 神经 元 连接 权 值 的 学 习 问 题 。 而 且 ，BP 算法 是 数据 挖掘 和 机 器 学 习 中 
有 监督 学 习 的 一 个 重要 算法 。 

目前 流行 的 深度 学 习 的 概念 源 于 人 工 神经 网 络 的 研究 。 含 多 隐 层 的 多 层 感 知 器 就 是 一 种 深 
度 学 习 结 构 。 深 度 学 习 通过 组 合 低层 特征 形成 更 加 抽象 的 高 层 表示 属性 类 别 或 特征 ， 以 发 现 数 
据 的 分 布 式 特征 表示 。 深 度 学 习 的 概念 由 Hinton 等 人 于 2006 年 提出 。 基 于 深信 度 网 (DBN) 
提出 非 监 督 贪心 逐 层 训练 算法 ， 为 解决 深层 结构 相关 的 优化 难题 带 来 希望 ， 随 后 提出 多 层 自 动 
编码 器 深层 结构 。 此 外 Lecun 等 人 提出 的 卷 积 神经 网 络 是 第 一 个 真正 多 层 结构 学 习 算法 ， 它 利 
用 空间 相对 关系 减少 参数 数目 以 提高 训练 性 能 。 深 度 学 习 是 机 器 学 习 研究 中 的 一 个 新 的 领域 ， 
其 动机 在 于 建立 、 模 拟人 脑 进 行 分 析 学 习 的 神经 网 络 ， 它 模仿 人 脑 的 机 制 来 解释 数据 ， 例 如 图 
像 ， 声 音 和 文本 。 同 机 器 学 习 方法 一 样 ， 深 度 机 器 学 习 方法 也 有 监督 学 习 与 无 监督 学 习 之 分 。 
不 同 的 学 习 框架 下 建立 的 学 习 模型 很 是 不 同 。 例 如 ， 卷 积 神经 网 络 (CNNs) 就 是 一 种 深度 的 
监督 学 习 下 的 机 器 学 习 模型 ， 而 深度 置信 网 (DBNs) 就 是 一 种 无 监督 学 习 下 的 机 器 学 习 模型 。 


3. 遗传 算法 


遗传 算法 是 源 于 模拟 达尔 文 的 “优胜 和 劣 汰 、 适 者 生存 ”的 进化 论 和 也 德尔 .摩根 的 遗传 变 
异 理论 , 在 迭代 过 程 中 保持 已 有 的 结构 ， 同 时 寻找 更 好 的 结构 。 其 本 意 是 在 人 工 适 应 系统 中 设 
计 一 种 基于 自然 的 演化 机 制 。 

遗传 算法 是 建立 在 自然 选择 和 群体 遗传 学 基础 上 ， 通 过 自然 选择 、 杂 交 和 变异 实现 搜索 的 
方法 ， 其 基本 过 程 是 : 首先 采用 某 种 编码 方式 将 解 空间 映射 到 编码 空间 〈 可 以 是 位 串 、 实 数 等 ， 
具体 问题 中 ， 可 以 直接 采用 解 空间 的 形式 进行 编码 ， 也 可 以 直接 在 解 的 表示 上 进行 遗传 操作 ， 
从 而 易于 引入 特定 领域 的 启发 式 信息 ， 可 以 取得 比 二 进 制 编码 更 高 的 效率 。 实 数 编码 一 般 用 于 
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数值 优化 ， 有 序 串 编码 一 般 用 于 组 合 优 化 )， 每 个 编码 对 应 问题 的 一 个 解 , 称 为 染色 体 或 个 体 ; 
其 次 通过 随机 的 方法 产生 初始 解 〈 被 称 为 群体 或 种 群 )， 在 种 群 中 根据 适应 值 或 某 种 竞争 机 制 
选择 个 体 ( 适 应 值 就 是 解 的 满意 程度 ， 可 以 由 外 部 显 式 适 应 度 函数 计算 ， 也 可 以 由 系统 本 身 产 
生 ， 如 由 个 体 在 种 群 中 的 存活 量 和 繁殖 量 确定 )， 再 次 使 用 各 种 遗传 操作 算 子 (包括 杂交 ， 变 
异 等 ) 产生 下 一 代 〈 下 一 代 可 以 完全 替代 原 种 群 ， 即 非 重 县 种 群 .也 可 以 部 分 替代 原 种 群 中 一 
些 较 差 的 个 体 ， 即 重 倒 种群 )， 如 此 进化 下 去 ， 直 到 满足 期 望 的 终止 条 件 。 遗 传 算法 中 使 用 适 
应 度 这 个 概念 来 度量 种 群 中 的 各 个 个 体 在 优化 过 程 中 有 可 能 达到 最 优 解 的 优良 程度 。 度 量 个 体 
适应 度 的 函数 称 为 适应 度 函数 ， 适 应 度 函 数 的 定义 一 般 与 具体 问题 有 关 。 


4. 模拟 退火 算法 


模拟 退火 算法 (SA) 是 一 种 求解 全 局 优化 算法 。 模 拟 退 火 算法 的 基本 思想 来 源 于 物理 退火 
过 程 , 所 谓 物理 退火 过 程 包括 3 个 阶段 。 

(1) 加 温 阶段 。 其 目的 是 增强 粒子 的 热 运 动 ， 使 其 偏离 平衡 位 置 。 当 温度 足够 高 时 ， 固 体 
将 熔 解 为 液体 ， 从 而 消除 系统 原先 可 能 存在 的 非 均匀 态 ， 使 随后 进行 的 冷却 过 程 以 某 一 平衡 态 
为 起 点 。 

(2) 等 温 阶段 。 对 于 与 周围 环境 交换 热量 而 温度 不 变 的 封闭 系统 ， 系 统 状态 的 自发 变化 总 
是 朝 自由 能 减少 的 方向 进行 ， 当 自由 能 达到 最 小 时 ， 系 统 达 到 平衡 。 

(3) 冷却 阶段 。 其 目的 是 使 粒子 的 热 运动 减弱 并 渐 趋 有 序 ， 系 统 能 量 逐 渐 下 降 从 而 得 到 低 
能 的 晶体 结构 。 

模拟 退火 算法 的 思想 是 : 先 将 固体 加 热 至 熔化 ， 再 让 其 徐徐 冷却 ， 凝 固 成 规整 晶体 。 在 加 
热 固 体 时 , 固体 内 部 的 粒子 随 着 温度 的 升 高 , 粒子 排列 从 较 有 序 的 结晶 状态 转变 为 无 序 的 液态 ， 
这 个 过 程 称 为 熔 解 ， 此 时 内 能 增 大 ; 冷却 时 ， 液 体 粒子 随 着 温度 的 徐徐 降低 ， 粒 子 渐 趋 有 序 ， 
液体 凝固 成 固体 的 晶 态 ， 这 个 过 程 称 为 退火 。 最 后 在 常温 时 达到 基态 ， 内 能 减 为 最 小 。 


5， 禁忌 搜索 算法 


禁忌 搜索 算法 (TS) 是 模拟 人 类 智力 过 程 的 一 种 全 局 搜索 算法 ， 是 对 局 部 邻 域 搜索 的 一 种 
扩展 。 禁 忌 包 含 两 个 方面 的 意思 ， 一 方面 ， 当 沿 着 产生 相反 结果 的 道路 走 下 去 时 ， 也 不 会 陷入 
一 个 圈套 而 导致 无 处 可 逃 ， 另 一 方面 ， 在 必要 情况 下 ， 保 护 措施 允许 被 淘汰 ， 也 就 是 说 ， 某 种 
措施 被 强制 运用 时 ， 禁 忌 条 件 就 宣布 无 效 。 

禁忌 搜索 算法 的 基本 思想 是 : 首先 确定 一 个 初始 可 行 解 x，x 可 以 从 一 个 启发 式 算法 获得 
或 在 可 行 解 集合 义 中 任意 选择 ， 定 义 可 行 解 x 的 邻 域 移动 集 S ( x ) ， 从 邻 域 移动 集中 挑选 一 
个 能 改进 当前 解 x 的 移动 x”E S(x) ， 再 从 新 解 zx” 开始 ， 重 复 搜索 ， 如 果 邻 域 移动 集中 只 
能 接受 比 前 一 个 可 行 解 x 更 好 的 解 ， 搜 索 就 可 能 陷入 循环 。 为 了 避免 陷入 循环 和 局 部 最 优 ， 构 
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造 一 个 短期 循环 记忆 表 即 禁忌 表 来 存储 刚刚 进行 过 的 | 工 | (| 工 | 为 禁忌 表 长 度 ) 个 邻 域 移动 ， 这 
些 移动 称 为 禁忌 移动 , 对 于 当前 的 移动 , 在 以 后 的 |T| 次 循环 内 是 禁止 的 ， 以 避免 回 到 原始 解 ， 
| T | 次 后 释放 该 移动 。 禁 忌 表 是 一 个 循环 表 ， 搜 索 过 程 中 被 循环 地 修改 使 禁忌 表 始 终 保 存 着 
1T| 个 移动 ， 当 迭代 中 所 发现 的 最 好 解 无 法 改进 或 无 法 离开 时 ， 算 法 停止 。 

从 上 述 描述 中 可 以 看 到 ， 禁 鼠 搜索 算法 是 从 一 个 初始 可 行 解 出 发 ， 选 择 一 系列 使 目标 函数 
值 减少 最 多 《假设 求 极 小 值 问题 ) 的 特定 搜索 方向 〈 即 移动 ) 作为 试探 ， 同 时 为 了 避免 陷入 局 
部 最 优 解 ， 禁 鼠 搜索 采用 了 一 种 灵活 的 “记忆 ”技术 ， 即 禁忌 表 来 对 已 经 进行 的 优化 过 程 进 行 
记录 和 选择 ， 指 导 下 一 步 的 搜索 方向 。 禁 忌 表 中 保存 了 最 近 若 干 次 迭代 过 程 中 所 实现 的 移动 ， 
凡是 处 于 禁忌 表 中 的 移动 ， 在 当前 迭代 过 程 中 是 不 允许 实现 的 ， 这 样 可 以 避免 算法 重新 访问 在 
最 近 若 干 次 迭代 过 程 中 已 经 访问 过 的 解 ， 从 而 防止 了 循环 ， 帮 助 算法 摆脱 局 部 最 优 解 。 另 外 ， 
为 了 尽 可 能 不 错过 产生 最 优 解 的 “移动 ” 禁忌 搜索 算法 采用 获 视 准则 来 赦免 一 些 被 禁忌 的 优 
良 状 态 ， 进 而 保证 多 样 化 的 有 效 探索 以 最 终 实现 全 局 优化 。 


6.， 蚁 群 算法 


蚂蚁 是 一 种 群居 类 动物 , 常常 成 群 结 队 地 出 现 于 人 类 的 日 常生 活 环境 中 。 科学 工作 者 发 现 ， 
蚂蚁 的 个 体 行为 极其 简单 ， 群 体 却 表现 出 极其 复杂 的 行为 特征 ， 能 够 完成 复杂 的 任务 。 蚂 蚁 还 
能 够 适应 环境 的 变化 ， 表 现在 蚁 群 运动 路 线 上 突然 出 现 障碍 物 时 ， 蚂 蚁 能 够 很 快 地 重新 找到 最 
优 路 径 等 。 

蚂蚁 之 所 以 能 够 “ 闻 糖 ”而 聚 ， 是 因为 蚂蚁 释放 的 化 学 信息 物质 一 信息 素 和 生物 学 特性 
所 决定 的 。 通 过 观察 ， 人 类 发 现 蚂蚁 个 体 之 问 是 通过 信息 素 进行 信息 传递 ， 从 而 能 相互 协作 ， 
完成 复杂 的 任务 。 蚁 群 之 所 以 表现 出 复杂 有 序 的 行为 ， 与 个 体 之 间 的 信息 交流 与 相互 协作 起 着 
重要 的 作用 。 基 于 此 ， 相 关 学 者 提出 了 一 系列 的 蚁 群 优化 “ACO) 算法 。 

蚁 群 算法 的 原理 : 曲 蚁 在 寻找 食物 或 者 寻找 回 巢 的 路 径 中 ,会 在 它们 经 过 的 地 方 留 下 一 些 
信息 素 ， 而 信息 素 能 被 同一 蚁 群 中 后 来 的 蚂蚁 感受 到 ， 并 作为 一 种 信号 影响 后 到 者 的 行动 ( 具 
体 表 现在 后 到 的 蚂蚁 选择 有 信息 素 的 路 径 的 可 能 性 ， 比 选择 没有 信息 素 的 路 径 的 可 能 性 大 得 
多 )， 而 后 到 者 留 下 的 信息 素 会 对 原 有 的 信息 素 进行 加 强 ， 并 如 此 循环 下 去 。 这 样 ， 经 过 蚂蚁 
越 多 的 路 径 ， 在 后 到 蚂蚁 的 选择 中 被 选中 的 可 能 性 就 越 大 《〈 因 为 残留 的 信息 素 浓 度 较 大 )。 由 
于 在 一 定 的 时 间 内 , 越 短 的 路 径 会 被 越 多 的 蚂蚁 访问 ， 因 而 积累 的 信息 素 也 就 越 多 ， 在 下 一 个 
时 间 内 被 其 他 的 蚂蚁 选中 的 可 能 性 也 就 越 大 。 这 个 过 程 会 一 直 持续 到 所 有 的 蚂蚁 都 走 最 短 的 那 
一 条 路 径 为 止 。 这 种 行为 表现 出 一 种 信息 正 反馈 现象 : 某 一 路 径 上 走 过 的 蚂蚁 越 多 ， 则 后 到 者 
选择 该 路 径 的 概率 就 越 大 ， 因 此 距离 近 的 食物 源 会 吸引 越 来 越 多 的 蚂蚁 ， 信 息 素 浓度 的 增长 速 
度 就 会 越 快 ， 同 时 通过 这 种 信息 的 交流 ， 蚂 蚁 也 就 寻找 到 食物 与 蚁 穴 之 间 的 最 短路 径 了 。 

蚁 群 算法 的 模型 : 蚁 群 算法 的 主要 根据 是 信息 正 反馈 原理 和 某 种 启发 式 算法 的 有 机 结合 ， 


国 454 荐 。 钦 作 设计 师 教程 (第 5 版) 


其 优化 过 程 主要 包括 选择 、 更 新 以 及 协调 3 个 过 程 。 在 选择 过 程 中 ,信息 素 浓度 越 高 的 路 径 被 
选择 的 概率 越 大 ， 在 更 新 过 程 中 ， 路 径 上 的 信息 素 随 蚂 蚁 的 经 过 而 增长 ， 同 时 也 随时 间 的 推移 
而 挥发 ， 在 协调 过 程 中 ， 蚂 蚁 之 间 通 过 信息 素 进行 信息 交流 相互 协作 。 在 选择 和 更 新 过 程 中 ， 
较 好 的 解 〈 较 短 的 路 径 ) 通过 路 径 上 的 信息 素 得 到 加 强 ， 从 而 引导 下 一 代 蚂蚁 向 较 优 解 邻 域 搜 
索 使 算法 收敛， 同时 更 新 过 程 的 信息 素 挥发 又 使 得 算法 具有 探索 能 力 增加 解 的 多 样 性 ， 使 得 算 
法 不 易 陷 入 局 部 最 优 。 


7. 粒子 群 优化 算法 


粒子 群 算法 的 基本 思想 : 鸟 群 竟 食 飞行 时 ， 在 飞行 过 程 中 经 常会 突然 改变 方向 、 散 开 、 至 
集 ， 其 行为 不 可 预测 ， 但 其 整体 总 保持 一 致 性 ， 个 体 与 个 体 间 也 保持 着 最 适宜 的 距离 。 通 过 对 
类 似 生物 群体 行为 的 研究 ， 发 现 生物 群体 中 存在 着 一 种 信息 共享 机 制 ， 为 群体 的 进化 提供 了 一 
种 优势 ， 这 就 是 基本 粒子 群 算法 形成 的 基础 。 

后 来 ， 有 学 者 提出 了 粒子 群 优化 算法 (PSO)。 了 PSO 算法 将 鸟 群 运动 模型 中 的 栖息 地 类 比 
为 所 求 问题 的 解 空间 中 可 能 解 的 位 置 ， 通 过 个 体 间 的 信息 传递 ， 引 导 整 个 群体 向 可 能 解 的 方向 
移动 ， 增 加 发 现 较 好 解 的 可 能 性 。 群 体 中 的 鸟 被 抽象 为 一 个 个 没有 质量 、 没 有 形状 的 “粒子 ”， 
通过 这 些 “ 粒 子 ” 的 相互 协作 和 信息 共享 ， 在 解 空间 中 寻找 最 优 解 。 

在 PSO 算法 中 ， 每 个 优化 问题 的 潜在 解 都 可 以 想象 成 搜索 空间 中 的 一 只 鸟 ， 我 们 称 之 为 
“粒子 ” 粒子 在 搜索 空间 中 以 一 定 的 速度 飞行 ， 这 个 速度 根据 它 本 身 的 飞行 经 验 和 同伴 的 飞 
行经 验 来 动态 调整 。 所 有 的 粒子 都 有 一 个 被 目标 函数 决定 的 适应 值 ， 并 且 知 道 自己 到 目前 为 止 
发 现 的 最 好 位 置 和 当前 的 位 置 。 这 个 可 以 看 作 是 粒子 自己 的 飞行 经 验 。 除 此 之 外 ， 每 个 粒子 还 
知道 到 目前 为 止 整个 群体 中 所 有 粒子 发 现 的 最 好 位 置 。 这 个 可 以 看 作 是 粒子 的 同伴 的 经 验 。 每 
个 粒子 根据 下 列 信息 改变 自己 的 当前 位 置 : 四 当前 位 置 ，@ 当前 速度 ，@@ 当前 位 置 与 自己 
最 好 位 置 之 间 的 距离 ，@ 当前 位 置 与 自身 的 群体 最 好 位 置 之 间 的 距离 。 飞 行经 验 是 指 该 粒子 
本 身 所 找到 的 最 优 位 置 ， 称 之 为 个 体 极 值 ， 同 伴 飞行 经 验 是 指 该 粒子 周围 的 粒子 目前 找到 的 最 
优 解 ， 称 之 为 群体 极 值 。 当 以 整个 种 群 为 同伴 时 ， 算 法 称 之 为 全 局 粒子 群 算法 ， 当 同伴 只 取 种 
群 的 一 部 分 粒子 时 ， 则 形成 了 局 部 粒子 群 算法 。PSO 算法 中 所 有 粒子 均 有 一 个 适应 值 ， 通 常 由 
目标 函数 决定 ， 另 外 每 个 粒子 均 有 一 个 速度 决定 它们 飞翔 的 方向 与 距离 ， 然 后 粒子 群 追 随 当前 
的 最 优 粒 子 在 解 空间 中 搜索 。PSO 算法 由 随机 初始 化 形成 的 粒子 而 组 成 的 一 个 种 群 ， 以 欠 代 的 
方式 进行 搜索 而 得 到 最 优 解 。 
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数据 库 技术 是 研究 数据 库 的 结构 、 存 储 、 设 计 、 管 理 和 应 用 的 一 门 软件 学 科 。 数 据 库 系统 
本 质 上 是 一 个 用 计算 机 存储 信息 的 系统 。 数 据 库 管理 系统 是 位 于 用 户 与 操作 系统 之 间 的 一 层 数 
据 管理 软件 ， 其 基本 目标 是 提供 一 个 可 以 方便 、 有 效 地 存 取 数据 库 信 息 的 环境 。 数 据 库 就 是 信 
息 的 集合 ， 它 是 收集 计算 机 数据 的 仓库 或 容器 ， 系 统 用 户 可 以 对 这 些 数据 执行 一 系列 操作 。 设 
计数 据 库 系统 的 目的 是 为 了 管理 大 量 信息 ， 给 用 户 提供 数据 的 抽象 视图 ， 即 系统 隐藏 有 关 数 据 
存储 和 维护 的 某 些 细节 。 对 数据 的 管理 涉及 信息 存储 结构 的 定义 、 信 息 操作 机 制 的 提供 、 安 全 
性 保证 ， 以 及 多 用 户 对 数据 的 共享 问题 。 

本 章 主要 介绍 一 些 数据 库 的 背景 知识 和 基本 概念 ， 使 读者 了 解数 据 库 的 基本 内 容 ， 形 成 数 
据 库 系 统 的 总 体 框 架 ， 了 解数 据 库 系统 在 计算 机 系统 中 的 地 位 以 及 数据 库 系 统 的 功能 。 


9.1 基本 概念 


9.1.1 数据 库 与 数据 库 系 统 


数据 是 描述 事物 的 符号 记录 ， 它 具有 多 种 表现 形式 ， 可 以 是 文字 、 图 形 、 图 像 、 声 音 和 语 
言 等 。 信 息 是 现实 世界 事物 的 存在 方式 或 状态 的 反映 。 信 息 具 有 可 感知 、 可 存储 、 可 加 工 、 可 
传递 和 可 再 生 等 自然 属性 ， 信 息 已 是 社会 各 行 各 业 不 可 缺少 的 资源 ， 这 也 是 信息 的 社会 属性 。 
数据 是 信息 的 符号 表示 ， 而 信息 是 具有 特定 释义 和 意义 的 数据 。 

数据 库 系统 (DataBase System，DBS) 是 一 个 采用 了 数据 库 技术 ， 有 组 织 地 、 动 态 地 存储 
大 量 相关 数据 ， 方 便 多 用 户 访问 的 计算 机 系统 。 广 义 上 讲 ，DBS 是 由 数据 库 、 硬 件 、 软 件 和 人 
员 组 成 的 。 

(1) 数据 库 (DataBase，DB)。 数 据 库 是 统一 管理 的 、 长 期 储存 在 计算 机 内 的 、 有 组 织 的 
相关 数据 的 集合 。 其 特点 是 数据 间 联 系 密切 、 元 余 度 小 、 独 立 性 较 高 、 易 扩展 ， 并 且 可 为 各 类 
用 户 共 享 。 

(2) 硬件 。 硬 件 是 构成 计算 机 系统 的 各 种 物理 设备 ， 包 括 存 储 数据 所 需 的 外 部 设备 。 硬 件 
的 配置 应 满足 整个 数据 库 系统 的 需要 。 

(3) 软件 。 软件 包括 操作 系统 、 数据库 管理 系统 及 应 用 程序 。 数据库 管理 系统 简称 DBMS 
它 是 数据 库 系 统 的 核心 软件 , 需要 在 操作 系统 的 支持 下 工作 , 解决 如 何 科 学 地 组 织 和 储存 数据 ， 
如 何 高 效 地 获取 和 维护 数据 。 其 主要 功能 包括 数据 定义 功能 、 数 据 操纵 功能 、 数 据 库 的 运行 管 
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理 和 数据 库 的 建立 与 维护 。 

(4) 人 员 。 人 员 主 要 有 4 类 。 第 一 类 为 系统 分 析 员 和 数据 库 设计 人 员 ， 系 统 分 析 员 负责 应 
用 系统 的 需求 分 析 和 规范 说 明 ， 他 们 和 用 户 及 数据 库 管 理 员 一 起 确定 系统 的 硬件 配置 ， 并 参与 
数据 库 系统 的 概要 设计 ; 数据 库 设 计 人 员 负 责 数据 库 中 数据 的 确定 、 数 据 库 各 级 模式 的 设计 。 
第 二 类 为 应 用 程序 员 ， 负 责编 写 使 用 数据 库 的 应 用 程序 ， 这 些 应 用 程序 可 对 数据 进行 检索 、 建 
立 、 删 除 或 修改 。 第 三 类 为 最 终 用 户 ， 他 们 应 用 系统 的 接口 或 利用 查询 语言 访问 数据 库 。 第 四 
类 用 户 是 数据 库 管 理 员 (Data Base Administrator，DBA)， 负 责 数据 库 的 总 体 信息 控制 。DBA 
的 具体 职责 包括 决定 数据 库 中 的 信息 内 容 和 结构 ， 决 定数 据 库 的 存储 结构 和 存 取 策略 ， 定 义 数 
据 库 的 安全 性 要 求 和 完整 性 约束 条 件 ， 监 控 数 据 库 的 使 用 和 运行 ， 改 进 数 据 库 的 性 能 ， 重 组 和 
重 构 数据 库 ， 以 提高 系统 的 性 能 。 


9.1.2 数据库 管理 系统 的 功能 


数据 库 管理 系统 (DataBase Management System，DBMS) 主要 实现 对 共享 数据 有 效 地 组 
织 、 管 理 和 存 取 ， 故 DBMS 应 具有 以 下 六 个 方面 的 功能 。 


1. 数据 定义 
DBMS 提供 数据 定义 语言 (Data Definition Language，DDL)， 用 户 可 以 对 数据 库 的 结构 进 


行 描述 ， 包 括 外 模式 、 模 式 和 内 模式 的 定义 ; 数据 库 的 完整 性 定义 ， 安 全 保密 定义 ， 如 口令 、 
级 别 和 存 取 权限 等 。 这 些 定义 存储 在 数据 字典 中 ， 是 DBMS 运行 的 基本 依据 。 


2. 数据 库 操作 


DBMS 向 用 户 提 供 数据 操纵 语言 (Data Manipulation Language，DML)， 实 现 对 数据 库 中 
数据 的 基本 操作 ， 例 如 检索 、 插 入 、 修 改 和 删除 。DML 分 为 两 类 ， 即 宿主 型 和 自 含 型 。 所 谓 宿 
主 型 是 指 将 DML 语句 嵌入 某 种 主语 言 (如 C、COBOL 等 ) 中 使 用 ;， 自 含 型 是 指 可 以 单独 使 用 
DML 语句 ， 供 用 户 交 互 使 用 。 

3. 数据 库 运行 管理 

数据 库 在 运行 期 间 多 用 户 环境 下 的 并 发 控制 、 安 全 性 检查 和 存 取 控制 、 完 整 性 检查 和 执行 、 
运行 日 志 的 组 织 管理 、 事 务 管理 和 自动 恢复 等 是 DBMS 的 重要 组 成 部 分 , 这 些 功能 可 以 保证 数 
据 库 系 统 的 正常 运行 。 

4. 数据 的 组 织 、 存 储 和 管理 

DBMS 分 类 组 织 、 存 储 和 管理 各 种 数据 ， 包 括 数据 字典 、 用 户 数据 和 存 取 路 径 等 。 因 此 要 
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确定 以 何 种 文件 结构 和 存 取 方 式 在 存储 级 上 组 织 这 些 数 据 ， 以 提高 存 取 效 率 。 实 现 数据 间 的 联 
系 、 数 据 组 织 和 存储 的 基本 目标 是 提高 存储 空间 的 利用 率 。 


S.， 数据 库 的 建立 和 维护 


数据 库 的 建立 和 维护 包括 数据 库 的 初始 建立 、 数 据 的 转换 、 数 据 库 的 转 储 和 恢复 、 数 据 库 
的 重组 和 重 构 、 性 能 监测 和 分 析 等 。 


6 其 他 功能 


其 他 功能 包括 : DBMS 的 网 络 通信 功能 ， 一 个 DBMS 与 另 一 个 DBMAS 或 文件 系统 的 数 
据 转 换 功能 ， 异 构 数据 库 之 间 的 互 访 和 互 操作 能 力 等 。 


9.1.3 ”数据库 管 理 系统 的 特征 及 分 类 
1. DBMS 的 特征 


通过 DBMS 来 管理 数据 具有 以 下 特点 。 

(1) 数据 结构 化 且 统 一 管理 。 数 据 库 中 的 数据 由 DBMS 统一 管理 。 由 于 数据 库 系 统 采用 
复杂 的 数据 模型 表示 数据 结构 ， 数 据 模型 不 仅 描述 数据 本 身 的 特点 ， 还 描述 数据 之 间 的 联系 。 
数据 不 再 面向 某 个 应 用 ， 而 是 面向 整个 应 用 系统 。 数 据 易 维 护 、 易 扩展 ， 数 据 元 余 明显 减少 ， 
真正 实现 了 数据 的 共享 。 

(2) 有 较 高 的 数据 独立 性 。 数 据 的 独立 性 是 指数 据 与 程序 独立 ， 将 数据 的 定义 从 程序 中 分 
离 出 去 ， 由 DBMS 负责 数据 的 存储 ， 应 用 程序 关心 的 只 是 数据 的 逻辑 结构 ， 无 须 了 解数 据 在 磁 
盘 上 的 数据 库 中 的 存储 形式 ， 从 而 简化 应 用 程序 ， 大 大 减少 了 应 用 程序 编制 的 工作 量 。 数 据 的 
独立 性 包括 数据 的 物理 独立 性 和 数据 的 逻辑 独立 性 。 

(3) 数据 控制 功能 。 DBMS 提供 了 数据 控制 功能 ， 以 适应 共享 数据 的 环境 。 数据 控制 功能 
包括 对 数据 库 中 数据 的 安全 性 、 完 整 性 、 并 发 和 恢复 的 控制 。 

@ 数据 库 的 安全 性 。 数 据 库 的 安全 性 〈Security) 是 指 保护 数据 库 以 防止 不 合法 的 使 用 所 
造成 的 数据 泄漏 、 更 改 或 破坏 。 这 样 ， 用 户 只 能 按 规 定 对 数据 进行 处 理 ， 例 如 ， 划 分 了 不 同 的 
权限 ， 有 的 用 户 只 能 有 读数 据 的 权限 ， 有 的 用 户 有 修改 数据 的 权限 ， 用 户 只 能 在 规定 的 权限 范 
围 内 操纵 数据 库 。 

@ 数据 的 完整 性 。 数 据 库 的 完整 性 是 指数 据 库 的 正确 性 和 相 容 性 ， 是 防止 合法 用 户 使 用 
数据 库 时 向 数据 库 加 入 不 符合 语义 的 数据 ， 保 证 数据 库 中 的 数据 是 正确 的 ， 避 免 非法 的 更 新 。 

@ 并 发 控制 。 在 多 用 户 共享 的 系统 中 ， 许 多 用 户 可 能 同时 对 同一 数据 进行 操作 。DBMS 
的 并 发 控制 子 系统 负责 协调 并 发 事务 的 执行 ， 保 证 数据 库 的 完整 性 不 受 破坏 ， 避 免 用 户 得 到 不 
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正确 的 数据 。 

@ 故障 恢复 。 数 据 库 中 的 4 类 故障 是 事务 内 部 故障 、 系 统 故障 、 介 质 故 障 及 计算 机 病毒 。 
故障 恢复 主要 指 恢复 数据 库 本 身 ， 即 在 故障 引起 数据 库 当 前 状态 不 一 致 时 将 数据 库 恢 复 到 某 个 
正确 状态 或 一 致 状态 。 恢 复 的 原理 非常 简单 ， 就 是 要 建立 元 余 (Redundancy) 数据 。 换 句 话说 ， 
确定 数据 库 是 否 可 恢复 的 方法 就 是 其 包含 的 每 一 条 信息 是 否 都 可 以 利用 元 余 存储 在 别处 的 信 
息 重 构 。 宛 余 是 物理 级 的 ， 通 常 认为 逻辑 级 是 没有 宛 余 的 。 


2. DBMS 的 分 类 


DBMS 通常 可 分 为 以 下 三 类 。 

(1) 关系 数据 库 系统 (Relation DataBase Systems，RDBS)。 关 系数 据 库 系统 是 建立 在 关系 
数据 库 模 型 基础 上 的 数据 库 ， 借 助 于 集合 代数 等 概念 和 方法 来 处 理 数据 库 中 的 数据 。 目 前 主流 
的 关系 数据 库 有 Oracle、Db2、Sybase、Microsoft SQL Server、Microsoft Access、MySQL 
等 。 在 关系 模型 中 ， 实 体 以 及 实体 间 的 联系 都 是 用 关系 来 表示 的 。 在 一 个 给 定 的 现实 世界 领域 
中 ， 相 应 的 所 有 实体 及 实体 之 间 联系 的 关系 的 集合 构成 一 个 关系 数据 库 ， 也 有 型 和 值 之 分 。 关 
系数 据 库 的 型 也 称 为 关系 数据 库 模式 ， 它 是 对 关系 数据 库 的 描述 ， 是 关系 模式 的 集合 。 关 系数 
据 库 的 值 也 称 为 关系 数据 库 ， 是 关系 的 集合 。 关 系数 据 库 模 式 与 关系 数据 库 通常 统称 为 关系 数 
据 库 。 

(2) 面向 对 象 的 数据 库 系 统 (ObjectOriented DataBase System，OODBS)。 面 向 对 象 的 数 
据 库 系 统 是 支持 以 对 象形 式 对 数据 建 模 的 数据 库 管 理 系 统 ， 包 括 对 对 象 的 类 、 类 属性 的 继承 和 
子 类 的 支持 。 面 向 对 象 数据 库 系统 主要 有 两 个 特点 : 一 是 面向 对 象 数 据 模型 能 完整 地 描述 现实 
世界 的 数据 结构 ， 能 表达 数据 间 的 嵌 套 、 递 归 联 系 ， 二 是 具有 面向 对 象 技术 的 封装 性 和 继承 性 
提高 了 软件 的 可 重用 性 。 

(3) 对 象 关系 数据 库 系 统 (ObjectOriented Relation DataBase System，ORDBS )。 对 象 关系 
数据 库 系统 是 在 传统 的 关系 数据 模型 基础 上 提供 元 组 、 数 组 、 集 合 等 更 为 丰富 的 数据 类 型 以 及 
处 理 新 的 数据 类 型 操作 的 能 力 ， 这 样 形成 的 数据 模型 被 称 为 “对 象 关 系数 据 模型 ”， 基 于 对 象 
关系 数据 模型 的 DBS 称 为 对 象 关 系数 据 库 系统 。 


9.1.4 ”数据库 系统 的 体系 结构 


数据 库 系 统 是 数据 密集 型 应 用 的 核心 , 其 体系 结构 受 数据 库 运行 所 在 的 计算 机 系统 的 影响 
很 大 , 尤其 是 受 计算 机 体系 结构 中 的 连 网 、 并 行 和 分 布 的 影响 。 从 不 同 的 角度 或 不 同 层次 上 看 ， 
数据 库 系 统 体系 结构 不 同 ， 从 最 终 用 户 的 角度 看 ， 数 据 库 系统 体系 结构 分 为 集中 式 、 分 布 式 、 
CS 客户 端 /服务 器 ) 和 并 行 结构 ;从 数据 库 管 理 系统 的 角度 看 ， 数 据 库 系统 体系 结构 一 般 采 
用 三 级 模式 结构 。 
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1. 集中 式 数 据 库 系 统 


分 时 系统 环境 下 的 集中 式 数据 库 系 统 结构 诞生 于 20 世纪 60 年 代 中 期 。 当 时 的 硬件 和 操作 
系统 决定 了 分 时 系统 环境 下 的 集中 式 数据 库 系 统 结构 成 为 早期 数据 库 技术 的 首选 结构 。 在 这 种 
系统 中 ， 不 仅 数据 是 集中 的 ， 数 据 的 管理 也 是 集中 的 ， 数 据 库 系统 的 所 有 功能 〈 从 形式 的 用 户 
接口 到 DBMS 核心 ) 都 集中 在 DBMS 所 在 的 计算 机 上 ， 如 图 9-1 所 示 。 大 多 数 关系 DBMS 的 
产品 也 是 从 这 种 系统 结构 开始 发 展 的 ， 目 前 这 种 系统 还 在 使 用 。 


2. 客户 端 /服务 器 结构 


随 着 网 络 技术 的 迅猛 发 展 ， 很 多 现代 软件 都 采用 客户 端 /服务 器 体系 结构 ， 如 图 9-2 所 示 。 
在 这 种 结构 中 ， 一 个 处 理 机 (客户 端的 请 求 被 送 到 另 一 个 处 理 机 服务 器 ) 上 执行 。 其 主要 
特点 是 客户 端 与 服务 器 CPU 之 间 的 职责 明确 , 客户 端 主要 负责 数据 表示 服务 , 服务 器 主要 负责 
数据 库 服务 。 采 用 客户 端 /服务 器 结构 后 ,数据库 系 统 功 能 分 为 前 端 和 后 端 。 前端 主要 包括 图 形 
用 户 界面 、 表 格 生 成 和 报表 处 理 等 工具 ， 后 端 负责 存 取 结 构 、 查 询 计算 和 优化 、 并 发 控制 以 及 
故障 恢复 等 。 前 端 与 后 端 通过 SQL 或 应 用 程序 来 接口 。ODBC 〈 开 放 式 数据 库 互 连 ) 和 JDBC 
(Java 程序 数据 库 连接 ) 标准 定义 了 应 用 程序 和 数据 库 服务 器 通信 的 方法 ， 即 定义 了 应 用 程序 
接口 ， 应 用 程序 用 它 来 打开 与 数据 库 的 连接 、 发 送 查询 和 更 新 以 及 获取 返回 结果 等 。 


图 9-1 集中 式 服 务 器 结构 图 图 9-2 客户 端 / 服 务 器 结构 


数据 库 服务 器 一 般 可 分 为 事务 服务 器 和 数据 服务 器 。 
(1) 事务 服务 器 。 事 务 服务 器 也 称 查询 服务 器 。 它 提供 一 个 接口 ， 使 得 客户 端 可 以 发 出 执 
行 一 个 动作 的 请 求 , 服务 器 响应 客户 端 请 求 ， 并 将 执行 结果 返回 给 客户 端 。 用 户 端 可 以 用 SQL， 
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也 可 以 通过 应 用 程序 或 使 用 远程 过 程 调用 机 制 来 表达 请 求 。 一 个 典型 的 事务 服务 器 系统 包括 多 
个 在 共享 内 存 中 访问 数据 的 进程 ， 包 括 服务 器 进程 、 锁 管理 进程 、 写 进程 、 监 视 进 程 和 检查 点 
进程 。 

(2) 数据 服务 器 。 数 据 服务 器 系统 使 得 客户 端 可 以 与 服务 器 交互 ， 以 文件 或 页 面 为 单位 对 
数据 进行 读 取 或 更 新 。 数 据 服务 器 与 文件 服务 器 相 比 提供 更 强 的 功能 ， 所 支持 的 数据 单位 可 以 
比 文件 还 要 小 ， 如 页 、 元 组 或 对 象 ， 提 供 数 据 的 索引 机 制 和 事务 机 制 ， 使 得 客户 端 或 进程 发 生 
故障 时 数据 也 不 会 处 于 不 一 致 状态 。 


3. 并行 数 据 库 系统 


并 行 体系 结构 的 数据 库 系统 是 多 个 物理 上 连 在 一 起 的 CPU, 而 分 布 式 系统 是 多 个 地 理 上 分 
的 CPU。 并 行 体系 结构 的 数据 库 类 型 分 为 共享 内 存 式 多 处 理 器 和 无 共享 式 并 行 体系 结构 。 

1) 共享 内 存 式 多 处 理 器 

共享 内 存 式 多 处 理 器 是 指 一 台 计 算 机 上 同时 有 多 个 活动 的 CPU, 它们 共享 单个 内 存 和 一 个 
公共 磁盘 接口 ， 如 图 9-3 所 示 。 这 种 并 行 体系 结构 最 接近 于 传统 的 单 CPU 处 理 器 结构 ， 其 设计 
的 主要 挑战 是 用 N 个 CPU 来 得 到 倍 单 CPU 的 性 能 。 但 是 ， 由 于 不 同 的 CPU 对 公共 内 存 的 
访问 是 平等 的 ， 这 样 可 能 会 导致 一 个 CPU 访问 的 数据 被 另 一 个 CPU 修改 ， 所 以 必须 要 有 特殊 
的 处 理 。 然 而 ， 由 于 内 存 访问 采用 的 是 一 种 高 速 机 制 ， 这 种 机 制 很 难保 证 进行 内 存 划分 时 不 损 
失效 率 ， 所 以 这 些 共享 内 存 访 问 问题 会 随 着 CPU 个 数 的 增加 变 得 难以 解决 。 

2) 无 共享 式 并 行 体系 结构 

无 共享 式 并 行 体系 结构 是 指 一 台 计 算 机 上 同时 有 多 个 活动 的 CPU, 并 且 它们 都 有 自己 的 内 
存 和 磁盘 ， 如 图 9-4 所 示 ， 图 中 粗 线 表示 高 速 网 络 。 在 不 产生 混淆 的 情况 下 ， 该 结构 的 数据 库 
系统 也 称 为 并 行 数据 库 系统 。 各 个 承担 数据 库 服务 责任 的 CPU 划分 它们 自身 的 数据 , 通过 划分 
的 任务 以 及 通过 每 秒 兆 位 级 的 高 速 网 络 通信 完成 事务 查询 。 
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图 9-3 ”共享 式 多 处 理 器 体系 结构 图 9-4 无 共享 式 并 行 体系 结构 
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4. 分 布 式 数据 库 系 统 


分 布 式 DBMS 包括 物理 上 分 布 、 逻 辑 上 集中 的 分 布 式 数据 库 结构 和 物理 上 分 布 、 迪 辑 上 
分 布 的 分 布 式 数据 库 结 构 两 种 。 前 者 的 指导 思想 是 把 单位 的 数据 模式 〈 称 为 全 局 数据 模式 ) 按 
数据 来 源 和 用 途 合理 地 分 布 在 系统 的 多 个 结 点 上 ， 使 大 部 分 数据 可 以 就 地 或 就 近 存 取 。 数 据 在 
物理 上 分 布 后 ， 由 系统 统一 管理 ， 使 用 户 不 感到 数据 的 分 布 。 后 者 一 般 由 两 部 分 组 成 : 一 是 本 
结 点 的 数据 模式 ， 二 是 本 结 点 共享 的 其 他 结 点 上 有 关 的 数据 模式 。 结 点 间 的 数据 共享 由 双方 协 
商 确 定 。 这 种 数据 库 结构 有 利于 数据 库 的 集成 、 扩 展 和 重新 配置 。 
9.1.5 数据 库 的 三 级 模式 结构 

实际 上 ， 数 据 库 的 产品 很 多 ， 它 们 支持 不 同 的 数据 模型 ， 使 用 不 同 的 数据 库 语 言 ， 建 立 在 
不 同 的 操作 系统 上 。 数 据 的 存储 结构 也 各 不 相同 ， 但 体系 结构 基本 上 都 具有 相同 的 特征 ， 采 用 
“三 级 模式 和 两 级 映像 ”如 图 9-5 所 示 。 

用 户 A1 ”用 户 A2 ”用 户 A3 ”用 户 B1 ”用 户 B2 


主语 言 
十 DML| 


外 模式 /概念 模式 ”外 模式 /概念 模式 
映像 A 映像 B 


概念 模式 概念 视图 


2 
数据 库 (内 部 视图 
图 9-5 数据 库 系统 体系 结构 


数据 库 系 统 采 用 三 级 模式 结构 ， 这 是 数据 库 管理 系统 内 部 的 系统 结构 。 数 据 库 有 “型 ”和 
“ 值 ” 的 概念 ,“ 型 ”是 指 对 某 一 数据 的 结构 和 属性 的 说 明 ,“ 值 ”是 型 的 一 个 具体 赋值 。 

数据 库 系 统 设计 员 可 以 在 视图 层 、 罗 辑 层 和 物理 层 对 数据 进行 抽象 ， 通 过 外 模式 、 概 念 模 
式 和 内 模式 来 描述 不 同 层次 上 的 数据 特性 。 


内 模式 
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概念 模式 也 称 模式 ， 它 是 数据 库 中 全 部 数据 的 逻辑 结构 和 特征 的 描述 ， 由 若干 个 概念 记录 
类 型 组 成 ， 只 涉及 型 的 描述 ， 不 涉及 具体 的 值 。 概 念 模式 的 一 个 具体 值 称 为 模式 的 一 个 实例 ， 
同一 个 模式 可 以 有 很 多 实例 。 

概念 模式 反映 的 是 数据 库 的 结构 及 其 联系 ， 所 以 是 相对 稳定 的 ; 而 实例 反映 的 是 数据 库 某 
一 时 刻 的 状态 ， 所 以 是 相对 变动 的 。 

需要 说 明 的 是 ， 概 念 模式 不 仅 要 描述 概念 记录 类 型 ， 还 要 描述 记录 间 的 联系 、 操 作 以 及 数 
据 的 完整 性 和 安全 性 等 要 求 。 但 是 ， 概 念 模式 不 涉及 存储 结构 、 访 问 技术 等 细节 。 只 有 这 样 
概念 模式 才 算 做 到 了 “物理 数据 独立 性 ”。 

描述 概念 模式 的 数据 定义 语言 称 为 “模式 DDL (Schema Data Definition Language)”。 


2.， 外 模式 


外 模式 也 称 用 户 模式 或 子 模式 ， 是 用 户 与 数据 库 系统 的 接口 ， 是 用 户 用 到 的 那 部 分 数据 的 
描述 。 它 由 若干 个 外 部 记录 类 型 组 成 。 用 户 使 用 数据 操纵 语言 对 数据 库 进行 操作 ， 实 际 上 是 对 
外 模式 的 外 部 记录 进行 操作 。 

描述 外 模式 的 数据 定义 语言 称 为 “外 模式 DDL”。 有 了 外 模式 后 ， 程 序 员 不 必 关 心 概念 模 
式 ， 只 与 外 模式 发 生 联系 ， 按 外 模式 的 结构 存储 和 操纵 数据 。 


3. 内 模式 


内 模式 也 称 存 储 模式 ， 是 数据 物理 结构 和 存储 方式 的 描述 ， 是 数据 在 数据 库 内 部 的 表示 方 
式 ， 定 义 所 有 的 内 部 记录 类 型 、 索 引 和 文件 的 组 织 方式 ， 以 及 数据 控制 方面 的 细节 。 例 如 ， 记 
录 的 存储 方式 是 顺序 存储 ， 按 照 B 树 结构 存储 ， 还 是 Hash 方法 存储 ; 索引 按照 什么 方式 组 织 ; 
数据 是 否 压 缩 存储 ， 是 否 加 密 ; 数据 的 存储 记录 结构 有 何 规定 。 

描述 内 模式 的 数据 定义 语言 称 为 “内 模式 DDL”。 

注意 ， 内 部 记录 并 不 涉及 物理 记录 ， 也 不 涉及 设备 的 约束 。 它 比 内 模式 更 接近 于 物理 存储 
和 访问 的 那些 软件 机 制 ， 是 操作 系统 的 一 部 分 〈 即 文件 系统 )。 例 如 ， 从 磁盘 上 读 、 写 数据 。 

总 之 ， 数 据 按 外 模式 的 描述 提供 给 用 户 ， 按 内 模式 的 描述 存储 在 磁盘 上 ， 而 概念 模式 提供 
了 连接 这 两 级 模式 的 相对 稳定 的 中 间 层 ， 并 使 得 两 级 中 任意 一 级 的 改变 都 不 受 另 一 级 影响 。 


4. 两 级 映像 


数据 库 系统 在 三 级 模式 之 间 提供 了 两 级 映像 : 模式 /内 模式 映像 、 外 模式 /模式 映像 。 正 因 
为 这 两 级 映像 保证 了 数据 库 中 的 数据 具有 较 高 的 逻辑 独立 性 和 物理 独立 性 。 
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(1) 模式 /内 模式 映像 。 存 在 于 概念 级 和 内 部 级 之 间 ， 实 现 了 概念 模式 和 内 模式 之 间 的 相互 
转换 。 

(2) 外 模式 /模式 映像 。 存 在 于 外 部 级 和 概念 级 之 间 ， 实 现 了 外 模式 和 概念 模式 之 间 的 相互 
转换 。 

数据 的 独立 性 是 指数 据 与 程序 独立 ， 将 数据 的 定义 从 程序 中 分 离 出 去 ， 由 DBMS 负责 数 
据 的 存储 ， 从 而 简化 应 用 程序 ， 大 大 减少 应 用 程序 编制 的 工作 量 。 数 据 的 独立 性 是 由 DBMS 的 
二 级 映像 功能 来 保证 的 。 数 据 的 独立 性 包括 数据 的 物理 独立 性 和 数据 的 逻辑 独立 性 。 

(1) 数据 的 物理 独立 性 。 数 据 的 物理 独立 性 是 指 当 数据 库 的 内 模式 发 生 改 变 时 ， 数 据 的 由 
辑 结构 不 变 。 由 于 应 用 程序 处 理 的 只 是 数据 的 逻辑 结构 ， 这 样 物 理 独 立 性 可 以 保证 ， 当 数据 的 
物理 结构 改变 时 ， 应 用 程序 不 用 改变 。 但 是 ， 为 了 保证 应 用 程序 能 够 正确 执行 ， 需 要 修改 概念 
模式 和 内 模式 之 间 的 映像 。 

(2) 数据 的 逻辑 独立 性 。 数 据 的 逻辑 独立 性 是 指 用 户 的 应 用 程序 与 数据 库 的 逻辑 结构 是 相 
互 独立 的 。 数 据 的 逻辑 结构 发 生变 化 后 ， 用 户 程序 也 可 以 不 修改 。 但 是 ， 为 了 保证 应 用 程序 能 
够 正确 执行 ， 需 要 修改 外 模式 和 概念 模式 之 间 的 映像 。 


9.1.6 大 数据 


1. 大 数据 产生 的 背景 


大 数据 (Big Data) 是 指 “ 无 法 用 现 有 的 软件 工具 提取 、 存 储 、 搜 索 、 共 享 、 分 析 和 处 理 
的 海量 的 、 复 杂 的 数据 集合 ”。 大 数据 产生 的 背景 主要 有 以 下 4 个 方面 。 

(1) 数据 来 源 和 承载 方式 的 变革 。 由 于 物 联网 、 云 计算 、 移 动 互联 网 等 新 技术 的 发 展 ， 用 
户 在 线 的 每 一 次 点 击 、 每 一 次 评论 、 每 一 个 视频 点 播 ， 都 是 大 数据 的 典型 来 源 ， 而 遍布 地 球 各 
个 角落 的 手机 、PC、 平板 电脑 及 传感器 成 为 数据 来 源 和 承载 方式 。 可见， 只 有 大 连接 与 大 交互 ， 
才 有 大 数据 。 

(2) 全 球 数据 量 出 现 爆 炸 式 增长 。 由 于 视频 监控 、 智 能 终端 ”网 络 商 店 等 快速 普及 ， 使 得 
全 球 数 据 量 出 现 爆炸 式 增长 。 许 多 研究 表明 ， 未 来 数 年 数据 量 会 呈现 指数 增长 。 根 据 麦 肯 锡 全 
球 研究 院 (MGI) 估计 ， 全 球 企业 2010 年 在 硬盘 上 存储 了 超过 7EB (1EB 等 于 10"GB) 的 新 
数据 ,而 消费 者 在 PC 和 笔记 本 等 设备 上 存储 了 超过 6EB 的 新 数据 。 据 IDC(Intemet Data Center) 
预测 ， 到 2020 年 ， 全 球 以 电子 形式 存储 的 数据 量 将 达 32ZB。 

(3) 大 数据 已 经 成 为 一 种 自然 资源 。 许 多 研究 者 认为 : 大 数据 是 “未 来 的 新 石油 ”， 己 成 
为 一 种 新 的 经 济 资产 类 别 。 一 个 国家 拥有 数据 的 规模 、 活 性 及 解释 运用 的 能 力 将 成 为 综合 国力 
的 重要 组 成 部 分 。 

(4) 大 数据 日 益 重 要 ， 不 被 利用 就 是 成 本 。 大 数据 作为 一 种 数据 资产 当仁不让 地 成 为 现代 
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商业 社会 的 核心 竞争 力 ， 不 被 利用 就 是 企业 的 成 本 。 因 为 ， 数 据 资产 可 以 帮助 和 指导 企业 对 整 
个 业务 流程 进行 有 效 的 运营 和 优化 ， 帮 助 企 业 做 出 最 明智 的 决策 。 


2. 大 数据 的 特征 


大 数据 (Big Data) 是 指 “ 无 法 用 现 有 的 软件 工具 提取 、 存 储 、 搜 索 、 共 享 、 分 析 和 处 理 
的 海量 的 、 复 杂 的 数据 集合 ”。 业 界 通常 用 “4V” 来 概括 大 数据 的 特征 。 

大 量化 (Volume) 指数 据 体 量 巨大 。 随 着 IT 技术 的 迅猛 发 展 ， 数 据 量 级 已 从 TB (1012 字 
节 ) 发 展 至 PB 乃至 ZB， 可 称 海量 、 巨 量 乃 至 超 量 。 当 前 ， 典 型 个 人 计算 机 硬盘 的 容量 为 TB 
量 级 ， 而 一 些 大 企业 的 数据 量 已 经 接近 EB 量 级 。 

多 样 化 〈Variety) 指数 据 类 型 繁多 。 相 对 于 以 往 便于 存储 的 以 文本 为 主 的 结构 化 数据 ， 非 
结构 化 数据 越 来 越 多 ， 包 括 网 络 日 志 、 音 频 、 视 频 、 图 片 、 地 理 位 置信 息 等 ， 这 些 多 类 型 的 数 
据 对 数据 的 处 理 能 力 提出 了 更 高 的 要 求 。 

价值 密度 低 (Value) 指 大 量 的 不 相关 信息 导致 价值 密度 的 高 低 与 数据 总 量 的 大 小 成 反比 。 
以 视频 为 例 ， 一 部 一 小 时 的 视频 ， 在 连续 不 间断 的 监控 中 ， 有 用 数据 可 能 仅 有 一 两 秒 。 因 此 ， 
如 何 通 过 强大 的 机 器 算法 更 迅速 地 完成 数据 的 价值 “提纯 ” 如 何 对 未 来 趋势 与 模式 的 可 预测 
分 析 、 深 度 复杂 分 析 〈 机 器 学 习 、 人 工 智 能 VS 传统 商务 智能 咨询 、 报 告 等 )， 成 为 目前 大 数据 
背景 下 亟待 解决 的 难题 。 

快速 化 (Velocity) 指 处 理 速度 快 。 大 数据 时 代 对 时 效 性 要 求 很 高 ， 这 是 大 数据 区 分 于 传统 
数据 挖掘 的 最 显著 特征 。 因 为 ， 在 大 数据 环境 下 数据 流通 常 为 高 速 实时 数据 流 ， 而 且 需 要 快速 、 
持续 的 实时 处 理 ， 处 理工 具 也 在 快速 演进 ， 软 件 工程 及 人 工 智能 等 均 可 能 介入 。 

3， 理解 大 数据 


大 数据 不 仅仅 是 指 海量 的 信息 ， 更 强调 人 类 对 信息 的 筛选 、 处 理 ， 保 留 有 价值 的 信息 ， 即 
让 大 数据 更 有 意义 ， 挖 掘 其 潜在 的 “大 价值 ”这 才 是 对 大 数据 的 正确 理解 。 为 此 ， 有 许多 问题 


需要 研究 与 解决 。 

(1) 高 并 发 数据 存 取 的 性 能 要 求 及 数据 存储 的 横向 扩展 问题 。 目 前 ， 多 从 架构 和 并 行 等 方 
面 考虑 解决 。 

(2) 实现 大 数据 资源 化 、 知 识 化 、 普 适 化 的 问题 ， 解 决 这 些 问题 的 关键 是 对 非 结构 化 数据 
的 内 容 理解 。 

(3) 非 结构 化 海量 信息 的 智能 化 处 理 问题 ， 主 要 解决 自然 语言 理解 、 多 媒体 内 容 理解 、 机 
器 学 习 等 问题 。 

大 数据 时 代 主 要 面临 三 大 挑战 : 软件 和 数据 处 理 能 力 、 资 源 和 共享 管理 以 及 数据 处 理 的 可 
售 力 。 


(1) 软件 和 数据 处 理 能 力 。 应 用 大 数据 技术 ， 提 升 服务 能 力 和 运作 效率 ， 以 及 个 性 化 的 服 
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务 ， 比 如 医疗 、 了 卫生、 教育 等 部 门 。 

(2) 资源 和 共享 管理 。 应 用 大 数据 技术 ， 提 高 应 急 处 置 能 力 和 安全 防范 能 力 。 

(3) 数据 处 理 的 可 信 力 。 需 要 投资 建立 大 数据 的 处 理 分 析 平 台 ， 实 现 综合 治理 、 业 务 开拓 
等 目标 。 


4. 大 数据 产生 的 安全 风险 


2012 年 瑞士 达 沃 斯 论坛 上 发 布 的 《大 数据 大 影响 》 报 告 称 ， 数 据 已 成 为 一 种 新 的 经 济 资产 
类 别 ， 就 像 货币 或 黄金 一 样 。 因 此 ， 也 带 来 了 更 多 安全 风险 。 

(1) 大 数据 成 为 网 络 攻击 的 显著 目标 。 在 互联 网 环境 下 ， 大 数据 是 更 容易 被 “发 现 ”的 大 
目标 。 这 些 数据 会 吸引 更 多 的 潜在 攻击 者 ， 如 数据 的 大 量 汇集 ， 使 得 黑客 成 功 攻击 一 次 就 能 获 
得 更 多 数据 ， 无 形 中 降低 了 黑客 的 攻击 成 本 ， 增 加 了 “收益 率 ”。 

(2) 大 数据 加 大 了 隐私 泄露 风险 。 大量 数据 的 汇集 不 可 避免 地 加 大 了 用 户 隐私 泄露 的 风险 ， 
因为 数据 集中 存储 增加 了 泄露 风险 ; 另外 ， 一 些 敏 感 数据 的 所 有 权 和 使 用 权 并 没有 明确 界定 ， 
很 多 基于 大 数据 的 分 析 都 未 考虑 到 其 中 涉及 的 个 体 隐私 问题 。 

(3) 大 数据 威胁 现 有 的 存储 和 安防 措施 。 大 数据 存储 带 来 新 的 安全 问题 ， 数 据 大 集中 的 后 
果 是 复杂 多 样 的 数据 存储 在 一 起 ， 很 可 能 出 现 将 某 些 生产 数据 放 在 经 营 数据 存储 位 置 的 情况 ， 
致使 企业 安全 管理 不 合 规 。 大 数据 的 大 小 也 影响 到 安全 控制 措施 能 否 正 确 运 行 。 如 果 安 全 防护 
手段 的 更 新 升级 速度 无 法 跟 上 数据 量 非 线性 增长 的 步伐 ， 就 会 暴露 大 数据 安全 防护 的 漏洞 。 

(4) 大 数据 技术 成 为 黑客 的 攻击 手段 。 在 企业 用 数据 挖掘 和 数据 分 析 等 大 数据 技术 获取 商 
业 价 值 的 同时 ， 黑 客 也 在 利用 这 些 大 数据 技术 向 企业 发 起 攻击 。 黑 客 会 最 大 限度 地 收集 更 多 的 
有 用 信息 ， 例 如 社交 网 络 、 邮 件 、 微 博 、 电 子 商 务 、 电 话 和 家 庭 住址 等 信息 ， 大 数据 分 析 使 黑 
客 的 攻击 更 加 精准 。 

(5) 大 数据 成 为 高 级 可 持续 攻击 的 载体 。 传 统 的 检测 是 基于 单个 时 间 点 进行 的 基于 威胁 特 
征 的 实时 匹配 检测 ， 而 高 级 可 持续 攻击 (APT) 是 一 个 实施 过 程 ， 无 法 被 实时 检测 。 此 外 ， 大 
数据 的 价值 低 密度 性 使 得 安全 分 析 工 具 很 难 聚 焦 在 价值 点 上 ， 黑 客 可 以 将 攻击 隐藏 在 大 数据 
中 ， 给 安全 服务 提供 商 的 分 析 制 造 很 大 困难 。 黑 客 设置 的 任何 一 个 会 误导 安全 厂商 目标 信息 提 
取 和 检索 的 攻击 ， 都 会 导致 安全 监测 偏离 应 有 方向 。 

(6) 大 数据 技术 为 信息 安全 提供 新 支撑 。 当 然 , 大 数据 也 为 信息 安全 的 发 展 提供 了 新 机 遇 。 
大 数据 正在 为 安全 分 析 提 供 新 的 可 能 性 ， 对 于 海量 数据 的 分 析 有 助 于 信息 安全 服务 提供 商 更 好 
地 刻画 网 络 异常 行为 ， 从 而 找 出 数据 中 的 风险 点 。 对 实时 安全 和 商务 数据 结合 在 一 起 的 数据 进 
行 预防 性 分 析 ， 可 识别 钓鱼 攻击 , 防止 诈骗 和 阻止 黑客 入 侵 。 网 络 攻击 行为 总 会 留 下 蛛丝马迹 ， 
这 些 痕 迹 都 以 数据 的 形式 隐藏 在 大 数据 中 ， 利 用 大 数据 技术 整合 计算 和 处 理 资源 有 助 于 更 有 针 
对 性 地 应 对 信息 安全 威胁 ， 有 助 于 找到 攻击 的 源头 。 
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9.2 ”数据 模型 


9.2.1 基本 概念 


模型 就 是 对 现实 世界 特征 的 模拟 和 抽象 ， 数 据 模型 是 对 现实 世界 数据 特征 的 抽象 。 对 于 具 
体 的 模型 人 们 并 不 陌生 ， 如 航模 飞机 、 地 图 和 建筑 设计 沙盘 等 都 是 具体 的 模型 。 最 常用 的 数据 
模型 分 为 概念 数据 模型 和 基本 数据 模型 。 

(1) 概念 数据 模型 。 概 念 数据 模型 也 称 信息 模型 ， 是 按 用 户 的 观点 对 数据 和 信息 建 模 ， 是 
现实 世界 到 信息 世界 的 第 一 层 抽象 ， 强 调 其 语义 表达 功能 ， 易 于 用 户 理解 ， 是 用 户 和 数据 库 设 
计 人 员 交 流 的 语言 ， 主 要 用 于 数据 库 设计 。 这 类 模型 中 最 著名 的 是 实体 -联系 模型 ， 简 称 E-R 
模型 。 

(2) 基本 数据 模型 。 它 是 按 计 算 机 系统 的 观点 对 数据 建 模 ， 是 现实 世界 数据 特征 的 抽象 ， 
用 于 DBMS 的 实现 。 基本 的 数据 模型 有 层次 模型 、 网 状 模型 、 关 系 模型 和 面向 对 象 模型 (Object 
Oriented Model )。 


9.2.2 ”数据 模型 的 三 要 素 


数据 库 结构 的 基础 是 数据 模型 ， 是 用 来 描述 数据 的 一 组 概念 和 定义 。 数 据 模型 的 三 要 素 是 
数据 结构 、 数 据 操作 和 数据 的 约束 条 件 。 

(1) 数据 结构 。 数 据 结构 是 所 研究 的 对 象 类 型 的 集合 ， 是 对 系统 静态 特性 的 描述 。 

(2) 数据 操作 。 数 据 操作 是 对 数据 库 中 各 种 对 象 ( 型 ) 的 实例 值 》 允 许 执 行 的 操作 的 集 
合 ， 包 括 操作 及 操作 规则 。 例 如 操作 有 检索 、 插 入 、 删 除 和 修改 ， 操 作 规则 有 优先 级 别 等 。 数 
据 操 作 是 对 系统 动态 特性 的 描述 。 

(3) 数据 的 约束 条 件 。 数 据 的 约束 条 件 是 一 组 完整 性 规则 的 集合 。 也 就 是 说 ， 对 于 具体 的 
应 用 数据 必须 遵循 特定 的 语义 约束 条 件 ， 以 保证 数据 的 正确 、 有 效 和 相 容 。 例 如 某 单 位 人 事 管 
理 中 ， 要 求 在 职 的 “ 男 ” 职 工 的 年 龄 必须 大 于 18 岁 小 于 60， 工 程 师 的 基本 工资 不 能 低 于 1500 
元 ， 每 个 职工 可 担任 一 个 工种 ， 这 些 要 求 可 以 通过 建立 数据 的 约束 条 件 来 实现 。 


9.2.3”E-R 模型 


概念 模型 是 对 信息 世界 建 模 , 所 以 概念 模型 能 够 方便 、 准 确 地 表示 信息 世界 中 的 常用 概念 。 
概念 模型 有 很 多 种 表示 方法 ， 其 中 最 为 常用 的 是 PP.S.Chen 于 1976 年 提出 的 实体 -联系 方法 
(Entity Relationship Approach) 。 该 方法 用 E-R 图 来 描述 现实 世界 的 概念 模型 ， 称 为 实体 -联系 
模型 (Entity-Relationship Model，E-R 模型 ) 。 

E-R 模型 是 软件 工程 设计 中 的 一 个 重要 方法 ， 因 为 它 接近 于 人 的 思维 方式 ， 容 易 理 解 并 且 
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与 计算 机 无 关 ， 所 以 用 户 容 易 接受 ， 是 用 户 和 数据 库 设计 人 员 交 流 的 语言 。 但 是 ，E-R 模型 只 
E 说 明 实体 间 的 语义 联系 ， 还 不 能 进一步 地 详细 说 明 数据 结构 。 在 解决 实际 应 用 问题 时 ， 通 常 
先 设计 一 个 E-R 模型 ， 然 后 再 把 其 转换 成 计算 机 能 接受 的 数据 模型 。 


1. 实体 


在 E-R 模型 中 ,实体 用 矩形 表示 ,通常 矩形 框 内 写 明 实体 名 。 实 体 是 现实 世界 中 可 以 区 别 
于 其 他 对 象 的 “事件 ”或 “物体 ”。 例 如 ， 企 业 中 的 每 个 人 都 是 一 个 实体 。 每 个 实体 由 一 组 特 
性 (属性) 来 表示 ， 其 中 的 某 一 部 分 属性 可 以 唯一 标识 实体 ， 例 如 职工 实体 集中 的 职工 号 。 实 
体 集 是 具有 相同 属性 的 实体 集合 。 例 如 ， 学 校 的 所 有 教师 具有 相同 的 属性 ， 因 此 教师 的 集合 可 
以 定义 为 一 个 实体 集 ; 学 生 具 有 相同 的 属性 ， 因 此 学 生 的 集合 可 以 定义 为 另 一 个 实体 集 。 


2. 联系 


在 E-R 模型 中 ,联系 用 菱形 表示 ， 通常 菱形 框 内 写 明 联系 名 ， 并 用 无 向 边 分 别 与 有 关 实 体 连 接 
起 来 ， 同 时 在 无 向 边 旁 标 注 上 联系 的 类 型 (1 : 1、1 : n 或 m:n)。 实 体 的 联系 分 为 实体 内 部 的 
联系 和 实体 与 实体 之 间 的 联系 。 实 体内 部 的 联系 反映 数据 在 同一 记录 内 部 各 字段 间 的 联系 。 

1) 两 个 不 同 实体 之 间 的 联系 

两 个 不 同 实体 集 之 间 存 在 以 下 3 种 联系 类 型 。 

。 一 对 一 (1 : 1)。 指 实体 集中 的 一 个 实体 最 多 只 与 实体 集 互 中 的 一 个 实体 相 联 系 。 

。 一 对 多 (1 : n)。 表 示 实 体 集 EE 中 的 一 个 实体 可 与 实体 集 互 中 的 多 个 实体 相 联 系 。 

。 多 对 多 (m : n)。 表 示 实 体 集 互 中 的 多 个 实体 可 与 实体 集 E, 中 的 多 个 实体 相 联系 。 

例如 ， 图 9-6 表示 两 个 不 同 实体 集 之 间 的 联系 。 其 中 

(1) 电影 院 里 一 个 座位 只 能 坐 一 个 观众 ， 因 此 观众 与 座位 之 间 是 一 个 1 : 1 的 联系 ， 联 系 
名 为 V_S， 用 E-R 图 表示 如 图 9-6 Ca) 所 示 。 

(2) 部 门 DEPT 和 职工 EMP 实体 集 ， 若 一 个 职工 只 能 属于 一 个 部 门 ， 那 么 这 两 个 实体 集 之 
间 应 是 一 个 1 : n 的 联系 ， 联 系 名 为 D E， 用 E-R 图 表示 


如 图 9-6 (b) 所 示 。 观众 部 站 | [项目 | 
(3) 工程 项 目 PROJ 和 职工 EMP 实体 集 ， 若 一 个 职 <> Bs < 
工 可 以 参加 多 个 项 目 ， 一 个 项 目 可 以 有 多 个 职工 参加 ， 1 n m 
那么 这 两 个 实体 集 之 间 应 是 一 个 m : n 的 联系 ,联系 名 为 ” [座位 ] 职工 BT | 
PR E， 用 E-R 图 表示 如 图 9-6(c) 所 示 。 Ca) 1:1 Cb) lin Ce) min 
2) 两 个 以 上 不 同 实体 集 之 间 的 联系 图 9-6 两 个 不 同 实体 集 之 间 的 联系 


两 个 以 上 不 同 实体 集 之 间 存 在 1:1:1、1:1:m 13:m:m7 和 r:m:7 的 联系 例如， 图 
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9-7 表示 了 3 个 不 同 实体 集 之 间 的 联系 。 其 中 : 

(1) 图 9-7 (a) 表示 供应 商 Supp、 项 目 Proj 和 零件 Part 之 间 多 对 多 对 多 (r : n : m) 的 联 
系 , 联系 名 为 SP_P。 表示 供应 商 为 多 个 项 目 供应 多 种 零件 ,每 个 项 目 可 用 多 个 供应 商 供应 的 零 
件 ， 每 种 零件 可 由 不 同 的 供应 商 供应 的 语义 。 

(2) 图 9-7 (b) 表示 病房 、 病 人 和 医生 之 间 一 对 多 对 多 (1 : n : m) 的 联系 , 联系 名 为 P_D。 
表示 一 个 特 护 病房 有 多 个 病人 和 多 个 医生 ， 一 个 医生 只 负责 一 个 病房 ， 一 个 病人 只 属于 一 个 病 


房 的 语义 。 
Supp 病房 
4 i 
n SP r n PD m 
Proj Part 病人 医生 
(a) rn m (b) ln:m 


图 9-7 3 个 不 同 实体 集 之 间 的 联系 


注意 , 3 个 实体 集 之 间 的 多 对 多 联系 和 3 个 实体 集 两 两 之 间 的 多 对 多 联系 的 语义 是 不 同 的 。 
例如 ， 供 应 商 和 项 目 实体 集 之 间 的 “合同 ”联系 ， 表 示 供 应 商 为 哪儿 个 工程 签 了 合同 ; 供应 商 
与 零件 两 个 实体 集 之 间 的 “库存 ”联系 ， 表 示 供 应 商 库存 零件 的 数量 ; 项 目 与 零件 两 个 实体 集 
之 间 的 “组 成 ”联系 ， 表 示 一 个 项 目 由 哪 几 种 零件 组 成 。 

3) 同一 实体 集 内 的 二 元 联系 

同一 实体 集 内 的 各 实体 之 间 也 存在 1: 1、1 : n 和 m : n 的 联系 ， 如 图 9-8 所 示 。 


职工 职工 
1 n 1 1 
< > 
(1in (Cb 1:1 


图 9-8 同一 实体 集 之 间 的 1:n 和 1 :1 联系 


从 图 中 可 知 ， 职 工 实体 集中 的 领导 与 被 领导 的 联系 是 1 : n 的。 但 是 ， 职 工 实体 集中 的 婚 
姻 联 系 是 1: 1 的 。 


3. 属性 


属性 是 实体 某 方面 的 特性 。 例 如 ， 职 工 实体 集 具有 职工 号 、 姓 名 、 年 龄 、 参 加 工作 时 间 和 
通信 地 址 等 属性 。 每 个 属性 都 有 其 取 值 范围 ， 例 如 职工 号 为 000001 一 999999 的 6 位 整 型 数 ， 
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姓名 为 10 位 的 字符 串 ， 年 龄 的 取 值 范围 为 18 一 60 等 。 在 同一 实体 集中 ， 每 个 实体 的 属性 及 其 
域 是 相同 的 ， 但 可 能 取 不 同 的 值 。E-R 模型 中 的 属性 有 以 下 分 类 。 

(1) 简单 属性 和 复合 属性 。 简 单 属性 是 原子 的 、 不 可 再 分 的 ， 复 合 属性 可 以 细 分 为 更 小 的 
部 分 〈 即 划分 为 别 的 属性 ) 。 有 时 用 户 希望 访问 整个 属性 ， 有 时 希望 访问 属性 的 某 个 成 分 ， 那 
么 在 模式 设计 时 可 采用 复合 属性 。 例 如 ,职工 实体 集 的 通信 地 址 可 以 进一步 分 为 邮编 、 省 、 市 、 
街道 。 若 不 特别 声明 ， 通 常 指 的 是 简单 属性 。 

(2) 单 值 属性 和 多 值 属性 。 在 前 面 所 举 的 例子 中 ， 定 义 的 属性 对 于 一 个 特定 的 实体 都 只 有 
单独 的 一 个 值 。 例 如 ， 对 于 一 个 特定 的 职工 ， 只 对 应 一 个 职工 号 、 职 工 姓 名 ， 这 样 的 属性 称 为 
单 值 属性 。 但 是 ， 在 某 些 特定 情况 下 ， 一 个 属性 可 能 对 应 一 组 值 。 例 如 ， 职 工 可 能 有 0 个 、1 
个 或 多 个 亲属 ， 那 么 职工 的 亲属 的 姓名 可 能 有 多 个 数目 ， 这 样 的 属性 称 为 多 值 属性 。 

(3) NULL 属性 。 当 实体 在 某 个 属性 上 没有 值 或 属性 值 未 知 时 ， 使 用 NULL 值 ， 表 示 无 意 
义 或 不 知道 。 

(4) 派生 属性 。 派 生 属性 可 以 从 其 他 属性 得 来 。 例 如 ， 职 工 实体 集中 有 “参加 工作 时 间 ” 
和 “工作 年 限 ” 属 性 ， 那么 “工作 年 限 ” 的 值 可 以 由 当前 时 间 和 参加 工作 时 间 得 到 。 这 里 ，“ 工 
作 年 限 ” 就 是 一 个 派生 属性 。 

4. 实体 -联系 方法 

概念 模型 中 最 常用 的 方法 为 实体 -联系 方法 ， 简 称 E-R 方法 。 该 方法 直接 从 现实 世界 中 抽 
象 出 实体 和 实体 间 的 联系 ， 然 后 用 非常 直观 的 E-R 图 来 表示 数据 模型 。 在 E-R 图 中 有 如 表 9-1 
所 示 的 几 个 主要 构件 。 


表 9-1 E-R 图 中 的 主要 构件 


双边 逢 形 四 
妆 形 “一 全 


表示 联系 集 


双边 次 形 < 一 表示 弱 实 体 集 对 应 的 标识 性 联系 

椭圆 ”< OO 表示 属性 

线段 ”一 将 属性 与 相关 的 实体 集 连 接 ， 或 将 实体 集 与 联系 集 相连 
双 李 圆 SS》 表示 多 值 属 性 


虚 顶 


表示 派生 属性 
表示 一 个 实体 全 部 参与 到 联系 集中 


说 明 1: 在 E-R 图 中 ， 实 体 集中 作为 主 码 的 一 部 分 属性 以 下 划 线 标明 。 另 外 ， 在 实体 集 与 
联系 的 线段 上 标 上 联系 的 类 型 。 
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说 明 2: 在 本 书 中 ， 若 不 引起 误解 ， 实 体 集 有 时 简称 实体 ， 联 系 集 有 时 简称 联系 。 

【 例 9.1】 学 校 有 若干 个 系 ， 每 个 系 有 若干 名 教师 和 学 生 ; 每 个 教师 可 以 担任 若干 门 课程 ， 
并 参加 多 个 项 目 ; 每 个 学 生 可 以 同时 选修 多 门 课程 。 请 设计 该 学 校 教学 管理 系统 的 E-R 模型 ， 
要 求 给 出 每 个 实体 、 联 系 的 属性 。 

解 : 该 学 校 教学 管理 系统 的 E-R 模型 应 该 有 5 个 实体 ， 即 系 、 教 师 、 学 生 、 项 目 和 课程 。 

(1) 设计 各 实体 属性 如 下 : 

系 〈 系 号 ， 系 名 ， 主 任 名 ) 

教师 (教师 号 ， 教 师 名 ， 职 称 》 

学 生 (学 号 ， 姓 名 ,年龄 ， 性 别 》 

项 目 (项 目 号 ， 名 称 ， 负 责 人 ) 

课程 (课程 号 ,课程 名 ， 学 分 ) 

(2) 各 实体 之 间 的 联系 如 下 : 

教师 担任 课程 的 1 : n“ 任 课 ” 联 系 ， 教师 参加 项 目的 n : m“ 参 加 ”联系 ， 学生 选修 课程 
的 :mm “选修 ”联系 ; 教师、 学 生 与 系 之 间 所 属 关 系 的 1 : n : m“ 领 导 ” 联 系 。 其 中 ,“ 参 加 ” 
联系 有 一 个 排名 属性 ,“ 选 修 ” 联 系 有 一 个 成 绩 属性 。 

通过 上 述 分 析 ， 该 学 校 教学 管理 系统 的 E-R 模型 如 图 9-9 所 示 。 


学 分 


二 一 、 
图 9-9 学校 教 学 管理 系统 的 E-R 模型 
需要 特别 指出 的 是 ，E-R 模型 强调 的 是 语义 ， 与 现实 世界 的 问题 密切 相关 。 这 人 句 话 的 意思 
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是 ， 尽 管 都 是 学 校 教学 管理 ， 但 由 于 不 同 的 学 校 教学 管理 的 方法 可 能 会 有 不 同 的 语义 ， 因 此 会 
得 到 不 同 的 E-R 模型 。 

S. 扩充 的 卫 -R 模型 

尽管 基本 的 E-R 模型 足以 对 大 多 数 数据 库 特 征 建 模 , 但 数据 库 某 些 情况 下 的 特殊 语义 仅 用 
基本 E-R 模型 无 法 表达 清楚 。 在 这 一 节 中 将 讨论 扩充 的 E-R 模型 ， 包 括 弱 实 体 、 特 殊 化 、 普 遍 

1) 弱 实体 

在 现实 世界 中 有 一 种 特殊 的 联系 ， 这 种 联系 代表 实体 间 的 所 有 ‘Ownership〉 关 系 ， 例 如 
职工 与 家 属 的 联系 ， 家 属 总 是 属于 某 职工 的 。 这 种 实体 对 于 另 一 些 实体 具有 很 强 的 依赖 关系 ， 
即 一 个 实体 的 存在 必须 以 另 一 个 实体 为 前 提 ， 将 这 类 实体 称 为 弱 实体 。 

在 扩展 的 E-R 图 中 ， 弱 实体 用 双 线 矩形 框 表示 。 图 9-10 为 职工 与 家 属 的 E-R 图 。 


图 9-10 弱 实 体 与 依赖 联系 


2) 特殊 化 

前 面 已 经 介绍 ， 实 体 集 是 具有 相同 属性 的 实体 集合 。 但 在 现实 世界 中 ， 某 些 实体 一 方面 具 
有 -一些 共 性 ， 另 一 方面 还 具有 各 自 的 特殊 性 。 这 样 ， 一 个 实体 集 可 以 按照 革 些 特征 区 分 为 几 个 
子 实 体 。 例 如 ， 学 生 实 体 集 可 以 分 为 研究 生 、 本 科 生 和 大 专 生 等 子 集 。 将 这 种 从 普遍 到 特殊 的 
过 程 称 为 “特殊 化 ”。 

将 几 个 具有 共同 特性 的 实体 集 概括 成 一 个 更 普遍 的 实体 集 的 过 程 称 为 “普遍 化 ”。 例 如 ， 
可 以 将 大 专 生 、 本 科 生 和 研究 生 概括 为 学 生 ， 还 可 以 将 学 生 、 教 师 和 职工 概括 为 人 。 这 就 是 从 
特殊 到 一 般 的 过 程 。 

设 有 实体 集 E ， 如 果 S 是 E 的 某 些 真 子 集 的 集合 ， 记 为 S$={5;15; cE,i=1,2,…,n}， 则 
称 S 是 E 的 一 个 特殊 化 ，E 是 S，5S,,…，5S, 的 超 类 ，S,，5S,,…，5, 称 为 EE 的 子 类 。 

如 果 js =， 则 称 5 是 的 全 特殊 化 ， 否 则 是 的 部 分 特殊 化 。 


i1 


如 果 5; 站 5S; = ,i 7 ， 则 S 是 不 相交 特殊 化 ， 否 则 是 重 琶 特殊 化 。 
教 职 工 实体 集中 的 某 个 职工 既是 在 职 生 又 是 教师 或 工人 ， 那 么 在 职 生 、 教 师 和 工人 应 该 是 
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重叠 特 殊 化 ， 而 在 职 生 、 教 师 和 工人 的 集合 等 于 教 职 工 ， 所 以 是 全 部 特殊 化 。 

在 扩充 的 E-R 模型 中 ， 子 类 继承 超 类 的 所 有 属性 和 联系 ,但 是 ， 子 类 还 有 自己 特殊 的 属性 
和 联系 。 例 如 ， 研 究 生 除了 学 习 以 外 ， 还 要 参加 科研 项 目 。 那 么 ,研究生 不 仅 要 继承 学 生 的 所 
有 属性 ， 还 要 增加 学 位 类 型 、 导 师 的 属性 ， 并 且 需 要 增加 与 项 目的 联系 。 

在 扩充 的 E-R 图 中 ， 超 类 - 子 类 关系 模型 使 用 特殊 化 圆圈 和 连 线 的 一 般 方 式 来 表示 。 超 类 
到 圆圈 有 一 条 连 线 ， 连 线 为 双 线 表示 全 特殊 化 ， 连 线 为 单线 表示 部 分 特殊 化 ， 双 竖 边 矩形 框 表 
示 子 类 ; 有 符号 “U ”的 线 表示 特殊 化 ; 圆圈 中 的 d 表示 不 相交 特殊 化 ， 圆 圈 中 的 o 表示 重合 
特殊 化 ， 超 类 与 圆圈 用 单线 相连 ， 表 示 部 分 特殊 化 。 图 9-11 给 出 了 一 个 特殊 化 应 用 实例 。 


图 9-11 特殊 化 应 用 实例 


9.2.4 数据 模型 


在 数据 库 领 域 中 常见 的 数据 模型 有 层次 模型 、 网 状 模型 、 关 系 模型 和 面向 对 象 模 型 。 本 章 
重点 介绍 关系 模型 。 
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(1) 层次 模型 (Hierarchical Model) 采用 树 型 结构 表示 数据 与 数据 间 的 联系 。 在 层次 模型 
中 ， 每 一 个 结 点 表示 一 个 记录 类 型 (实体 )， 记 录 之 间 的 联系 用 结 点 之 间 的 连 线 表 示 ， 并 且 根 
结 点 以 外 的 其 他 结 点 有 且 仅 有 一 个 双亲 结 点 。 

(2) 网 状 模型 (Network Model) 也 称 DBTG 模型 ， 该 是 一 个 比 层次 模型 更 具有 普遍 性 的 
数据 结构 ， 是 层次 模型 的 一 个 特例 。 网 状 模型 可 以 直接 地 描述 现实 世界 ， 因 为 去 掉 了 层次 模型 
的 两 个 限制 ， 允 许 两 个 结 点 之 间 有 多 种 联系 〈 称 之 为 复合 联系 )。 

(3) 关系 模型 (Relational Model) 是 目前 最 常用 的 数据 模型 之 一 。 关 系数 据 库 系统 采用 关 
系 模型 作为 数据 的 组 织 方式 ， 在 关系 模型 中 用 表格 结构 表达 实体 集 以 及 实体 集 之 间 的 联系 ， 其 
最 大 特色 是 描述 的 一 致 性 。 

(4) 面向 对 象 模型 (Object Oriented Model) 采用 面向 对 象 的 方法 来 设计 数据 库 。 面 向 对 象 
的 数据 库存 储 对 象 是 以 对 象 为 单位 ， 每 个 对 象 包 含 对 象 的 属性 和 方法 ， 具 有 类 和 继承 等 特点 。 
Computer Associates 的 Jasmine 就 是 面向 对 象 模型 的 数据 库 系统 。 

面向 对 象 数据 模型 比 网 络 、 层 次 、 关 系数 据 模型 具有 更 加 丰富 的 表达 能 力 。 但 正 因为 面向 
对 象 模型 的 丰富 表达 能 力 ， 模 型 相对 复杂 ， 实 现 起 来 较 困 难 。 


9.2.5 ”关系 模型 


关系 模型 (Relation Model) 是 目前 最 常用 的 数据 模型 之 一 。 关 系数 据 库 系统 采用 关系 模 
型 作为 数据 的 组 织 方式 ， 在 关系 模型 中 用 表格 结构 表达 实体 集 以 及 实体 集 之 间 的 联系 ， 其 最 大 
特色 是 描述 的 一 致 性 。 关 系 模型 是 由 若干 个 关系 模式 组 成 的 集合 。 一 个 关系 模式 相当 于 一 个 记 
录 型 ， 对 应 于 程序 设计 语言 中 类 型 定义 的 概念 。 关 系 是 一 个 实例 ， 也 是 一 张 表 ， 对 应 于 程序 设 
计 语 言 中 变量 的 概念 。 给 定 变量 的 值 随时 间 可 能 发 生变 化 ， 类 似 地 ， 当 关系 被 更 新 时 ， 关 系 实 
例 的 内 容 也 随时 间 发 生 了 变化 。 

【 例 9.2】 教学 数据 库 的 4 个 关系 模式 如 下 : 

S (Sno,Sname,SD,Sage,Sex) ; 学 生 S 关系 模式 ， 属 性 为 学 号 、 姓 名 、 系 、 年 龄 和 性 别 

T(Tno,Tname,Age,Sex) 。”; 教师 工 关系 模式 ， 属 性 为 教师 号 、 姓 名 、 年 龄 和 性 别 


C (Cno.Cname.Pcno) ; 课程 C 关 系 模式 ， 属 性 为 课程 号 、 课 程 名 和 先 修 课程 号 
SC (Sno,Cno,Grade) ; 学 生 选 课 SC 关系 模式 ， 属 性 为 学 号 、 课 程 号 和 成 绩 


关系 模式 中 有 下 划 线 的 属性 是 主 码 属性 。 图 9-12 是 教学 模型 的 一 个 具体 实例 。 

由 于 关系 模型 比 网 状 、 层 次 模型 更 加 简单 、 灵 活 ， 因 此 ， 在 数据 处 理 领域 中 ， 关 系数 据 库 
的 使 用 已 相当 普遍 。 但 是 ， 现 实 世 界 中 存在 着 许多 含有 更 复杂 数据 结构 的 实际 应 用 领域 ， 例 如 
CAD 数据 、 图 形 数据 和 人 工 智 能 研究 等 ， 需 要 有 一 种 数据 模型 来 表达 这 类 信息 ， 这 种 数据 模型 
就 是 面向 对 象 的 数据 模型 。 
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S 学 生 关系 T 教 师 关 系 


图 9-12 关系 模型 的 实例 


9.3 ”关系 代数 


9.3.1 关系 数据 库 的 基本 概念 
1. 属性 和 域 


在 现实 世界 中 ， 要 描述 一 个 事物 常常 取 若干 特征 来 表示 ， 这 些 特 征 称 为 属性 (Attribute)。 

例如 ， 用 学 号 、 姓 名 、 性 别 、 系 别 、 年 龄 和 籍贯 等 属性 来 描述 学 生 。 每 个 属性 的 取 值 范围 对 应 

-个 值 的 集合 ， 称 为 该 属性 的 域 (Domain)。 例 如 ， 学 号 的 域 是 6 位 整 型 数 ， 姓名 的 域 是 10 位 
字符 ; 性别 的 域 为 { 男 ， 女 } 等 。 

在 关系 数据 模型 中 ， 通 常 对 域 加 了 一 个 限制 ， 所 有 的 域 都 应 是 原子 数据 (Atomic Data)。 
例如 ， 整 数 、 字 符 串 是 原子 数据 ， 而 集合 、 记 录 、 数 组 是 非 原子 数据 。 关 系数 据 模型 的 这 种 限 
制 称 为 第 一 范式 (First Normal Form，1NF) 条 件 。 但 也 有 些 关 系数 据 模型 突破 了 1NF 的 限制 ， 
称 为 非 INF 的 关系 数据 模型 。 

2. 笛 卡 儿 积 与 关系 

【定义 9.1】 设 D1,D,,…,D;…,D,; 为 任意 集合 ， 定 义 Di.D .Di…: 疡 的 笛 卡 儿 积 为 

DXD,X:…XD,X:…XD,={(d,d,,",d;,"%d,)|di eD,,i=1,2,3,.,n} 
其 中 ， 每 一 个 元 素 (qi,qd,,…,4;,…d, ) 称 为 一 个 n 元 组 (n-tuple 属性 的 个 数 )， 元 组 的 每 一 个 值 
qi; 称 为 元 组 的 一 个 分 量 ， 若 D(i=1,2,3,…,n) 为 有 限 集 ， 其 基数 (Cardinal number 元 组 的 个 数 ) 
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为 mGi=12,3,…,n)， 则 DXD,X…XD;X…XD, 的 基数 MM 为 M = TI 笛 卡 儿 积 可 以 用 二 


【 例 9.3】 若 忆 ={0.1 ， ={a,B}, = 求 马 XD XD 


解 : 根据 定义 ， 千 卡 儿 积 中 的 每 个 i 元 素 应 该 是 一 个 三 元 组 ， 每 个 分 量 来 自 不 同 的 域 ， 因 


D, xXxD, XD,={(0,a,c).(0,a,q).(0,b.c),(0,b,4).(1,a,c),(l,a.q),(l,b,c).(1,5,q)} 
用 二 维 表 表示 如 图 9-13 所 示 。 


09.05 


图 9-13 D1XD,XxD3 第 卡 儿 积 的 二 维 表 表 示 


a c 
a 
b 
b 
a 
a 
b 
b 


【定义 9.2】D, xD, X…X DX…X 妃 , 的 子 集 称 为 在 域 Di,D,…,D;,…,D, 上 的 关系 ， 记 为 R 
( Di,D,…,D;,…,D, )， 称 关系 尺 为 n 元 关系 。 

从 定义 9.2 可 以 得 出 一 个 关系 也 可 以 用 二 维 表 来 表示 。 关 系 中 属性 的 个 数 称 为 “元 数 ” 元 
组 的 个 数 称 为 “基数 ”。 关 系 模型 中 的 术语 与 一 般 术语 的 对 应 情况 可 以 通过 图 9-14 中 的 学 生 关 
系 说 明 。 图 中 的 学 生 关 系 模式 可 表示 为 学 生 (S_no,Sname,SD,Sex)。 该 学生 关系 的 主 码 为 S_no， 
属性 分 别 为 S_no、Sname、SD 和 Sex， 对 属性 Sex 的 域 为 男 、 女 ， 等 等 。 该 学 生 关系 的 元 数 为 


4， 基 数 为 6。 
关系 模型 术语 二 般 术语 


1 2 4 

属性 属性 a 3 人 属性 字段 、 数据 项 
Sno Sex 关系 模式 记录 类 型 
100101 男 元 组 1 记录 1 
100102 男 元 组 2 记录 2 
100103 女 元 组 3 记录 3 
200101 男 元 组 4 记录 4 
300102 EE 元 组 5 记录 5 
300103 男 元 组 6 记录 6 


9-14 ”学生 关系 与 术语 的 对 应 情况 
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3. 关系 的 相关 名 词 


(1) 目 或 度 (Degree)。 这 里 的 RR 表示 关系 的 名 字 ，n 是 关系 的 目 或 度 。 

(2) 候选 码 (Candidate Key)。 若 关系 中 的 某 一 属性 或 属性 组 的 值 能 唯一 地 标识 一 个 元 组 
则 称 该 属性 或 属性 组 为 候选 码 。 

(3) 主 码 (Primary Key)。 若 一 个 关系 有 多 个 候选 码 ， 则 选 定 其 中 一 个 为 主 码 。 

(4) 主 属性 (Non-Key attribute)。 包 含 在 任何 候选 码 中 的 诸 属 性 称 为 主 属性 。 不 包含 在 任 
何 候选 码 中 的 属性 称 为 非 码 属性 。 

(5) 外 码 (Foreign Key)。 如 果 关 系 模式 R 中 的 属性 或 属性 组 非 该 关系 的 码 ， 但 它 是 其 他 
关系 的 码 ， 那 么 该 属性 集 对 关系 模式 R 而 言 是 外 码 。 

例如 客户 与 贷款 之 间 的 借贷 联系 c-1 (ec-id, loan-no)， 属 性 c-id 是 客户 关系 中 的 码 ， 所 以 
c-id 是 外 码 ， 属 性 loan-no 是 贷款 关系 中 的 码 ， 所 以 loan-no 也 是 外 码 。 

(6) 全 码 (All-Key)。 关 系 模型 的 所 有 属性 组 是 这 个 关系 模式 的 候选 码 ， 称 为 全 码 。 

例如 关系 模式 R(T，C，S)， 属 性 了 表示 教师 ， 属 性 C 表示 课程 ， 属 性 8 表示 学 生 。 假 设 
一 个 教师 可 以 讲授 多 门 课程 ， 某 门 课程 可 以 由 多 个 教师 讲授 ， 学 生 可 以 听 不 同 教师 讲授 的 不 同 
课程 ， 那 么 ， 要 想 区 分 关系 中 的 每 一 个 元 组 ， 这 个 关系 模式 R 的 码 应 为 全 属性 T、C 和 5S， 即 
All-Key。 


4. 关系 的 3 种 类 型 


(1) 基本 关系 。 通 常 又 称 为 基本 表 或 基 表 ， 它 是 实际 存在 的 表 ， 是 实际 存储 数据 的 逻辑 

(2) 查询 表 。 查 询 表 是 查询 结果 对 应 的 表 。 

(3) 视图 表 。 视 图 表 是 由 基本 表 或 其 他 视图 表 导 出 的 表 。 由 于 它 本 身 不 独立 存储 在 数据 库 
中 ， 数 据 库 中 只 存放 它 的 定义 ， 所 以 常 称 为 虚 表 。 


S.， 关系 数据 库 模式 


在 数据 库 中 要 区 分 型 和 值 。 关 系数 据 库 中 的 型 也 称 为 关系 数据 库 模式 ， 是 关系 数据 库 结构 的 
描述 。 它 包括 若干 域 的 定义 以 及 在 这 些 域 上 定义 的 若干 关系 模式 。 实 际 上 ， 关 系 的 概念 对 应 于 程 
序 设计 语言 中 变量 的 概念 ， 而 关系 模式 对 应 于 程序 设计 语言 中 类 型 定义 的 概念 。 关 系数 据 库 的 值 
是 这 些 关 系 模式 在 某 一 时 刻 对 应 的 关系 的 集合 ， 通 常 称 之 为 关系 数据 库 。 

【定义 9.3】 关系 的 描述 称 为 关系 模式 (Relation Schema)， 可 以 形式 化 地 表示 为 : 

R (U, D, dom, F) 
其 中 ，R 表示 关系 名 ; U 是 组 成 该 关系 的 属性 名 集合 ; D 是 属性 的 域 ，dom 是 属性 向 域 的 映像 
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集合 ; 为 属性 间 数 据 的 依赖 关系 集合 。 

通常 将 关系 模式 简 记 为 : 

R(U) 或 R(Ai, 4A,, A3,%, An) 

其 中 ，R 为 关系 名 ，41, 42, 43,…, 4 为 属性 名 或 域名 ， 属 性 向 域 的 映像 常常 直接 说 明 属性 的 类 
型 、 长 度 。 通 常 在 关系 模式 主 属性 上 加 下 划 线 表示 该 属性 为 主 码 属性 。 

例如 : 学 生 关系 S 有 学 号 Sno、 学 生 姓 名 Same、 系 名 SD、 年 龄 SA 属性 ; 课程 关系 C 有 
课程 号 Cno、 课程 名 Cname、 选 修 课 程 号 Pcno 属性 ; 学 生 选课 关系 SC 有 学 号 Sno、 课程 号 Cno、 
成 绩 Grade 属性 。 定 义 关系 模 式 及 主 码 如 下 (本题 未 考虑 下 属性 间 数 据 的 依赖 ， 该 问题 将 在 后 
面 讨论 )。 

(1) 学 生 关系 模式 S (Sno，Sname，SD，SA)。 

(2) 课程 关系 模式 C (Cno，Cname，Pcno) Dom (Pcno) =Cno。 这 里 ，Pcno 是 选修 课程 
号 ， 来 自 Cno 域 ， 由 于 Pcno 属性 名 不 等 于 Cno 值 域名 ， 所 以 要 用 Dom 来 定义 。 但 是 ， 不 能 将 
Peno 直接 改 为 Cho， 因 为 在 关系 模型 中 ， 各 列 属性 必须 取 相 异 的 名 字 。 

(3) 学 生 选课 关系 模式 SC (Sno，Cno，Grade)。SC 关系 中 的 Sho、Cno 又 分 别 为 外 码 ， 
因为 它们 分 别 是 S、C 关系 中 的 主 码 。 


6， 完整 性 约束 


完整 性 规则 提供 了 一 种 手段 来 保证 当 授 权 用 户 对 数据 库 做 修改 时 不 会 破坏 数据 的 一 致 性 。 
因此 ， 完 整 性 规则 防止 的 是 对 数据 的 意外 破坏 。 关 系 模型 的 完整 性 规则 是 对 关系 的 某 种 约束 条 
件 。 关 系 的 完整 性 共 分 为 三 类 : 实体 完整 性 、 参 照 完 整 性 (也 称 引 用 完整 性 ) 和 用 户 定义 完 
整 性 。 

(1) 实体 完整 性 (Entity Integrity)。 规 定 基 本 关系 R 的 主 属性 4 不 能 取 空 值 。 

(2) 参照 完整 性 〈Referential Integrity)。 现 实 世 界 中 的 实体 之 间 往往 存在 某 种 联系 ， 在 关 
系 模型 中 实体 及 实体 间 的 联系 是 用 关系 来 描述 的 ， 这 样 自然 就 存在 着 关系 与 关系 间 的 引用 。 

例如 ， 员 工 和 部 门 关 系 模式 的 表示 如 下 ， 其 中 在 关系 模式 主 属性 上 加 下 划 线 表示 该 属性 为 
主 码 属性 。 

员工 (员工 号 ， 姓名， 性 别 ， 参 加 工作 时 间 ， 部 门 号 ) 

部 门 〈 部 门 号 ， 名 称 ， 电 话 ， 负 责 人 ) 

这 两 个 关系 存在 着 属性 的 引用 ， 即 员工 关系 中 的 “部 门 号 ” 值 必须 是 确实 存在 的 部 门 的 部 
门 号 ， 即 部 门 关 系 中 有 该 部 门 的 记录 。 也 就 是 说 ， 员 工 关系 中 的 “部 门 号 ”属性 取 值 要 参照 部 
门 关系 的 “部 门 号 ”属性 取 值 。 

参照 完整 性 规定 ， 若 是 基本 关系 R 的 外 码 ， 它 与 基本 关系 8 的 主 码 K, 相对 应 (基本 关 
系 尺 和 8 不 一 定 是 不 同 的 关系 )， 则 对 于 R 中 每 个 元 组 在 上 的 值 或 者 取 空 值 (F 的 每 个 属性 
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值 均 为 空 值 )， 或 者 等 于 S 中 某 个 元 组 的 主 码 值 。 

(3) 用 户 定义 完整 性 (User Defined Integrity)。 用 户 定义 完整 性 就 是 针对 某 一 具体 的 关系 
数据 库 的 约束 条 件 , 反映 某 一 具体 应 用 所 涉及 的 数据 必须 满足 的 语义 要 求 , 由 应 用 的 环境 决定 。 
例如 ， 银 行 的 用 户 账 户 规定 必须 大 于 等 于 100 000、 小 于 999 999。 


7. 关系 运算 


关系 操作 的 特点 是 操作 对 象 和 操作 结果 都 是 集合 ， 而 非 关 系数 据 模型 的 数据 操作 方式 则 为 
一 次 一 个 记录 的 方式 。 关 系数 据 语言 分 为 三 类 : 关系 代数 语言 、 关 系 演 算 语言 和 具有 关系 代数 
和 关系 演算 双重 特点 的 语言 (例如 SQL)。 关 系 演算 语言 包含 元 组 关系 演算 语言 (例如 Aplha、 
Quel) 和 域 关系 演算 语言 (例如 QBE)。 

关系 代数 语言 、 元 组 关系 演算 和 域 关系 演算 是 抽象 查询 语言 ， 它 与 具体 的 DBMS 中 实现 的 
实际 语言 并 不 一 样 ， 但 是 可 以 用 它 评估 实际 系统 中 的 查询 语言 能 力 的 标准 。 

关系 代数 运算 符 有 4 类 : 集合 运算 符 、 专 门 的 关系 运算 符 、 算 术 比 较 符 和 轴 辑 运算 符 。 根 
据 运 算 符 的 不 同 ， 关 系 代数 运算 可 分 为 传统 的 集合 运算 和 专门 的 关系 运算 。 传 统 的 集合 运算 是 
从 关系 的 水 平方 向 进行 的 ， 包 括 并 、 交 、 差 及 广义 笛 卡 儿 积 。 专 门 的 关系 运算 既 可 以 从 关系 的 
水 平方 向 进行 运算 ， 又 可 以 向 关系 的 垂直 方向 运算 ， 包 括 选 择 、 投 影 、 连 接 以 及 除法 ， 如 表 9-2 
所 示 。 在 表 9-2 中 ， 并 、 差 、 笛 卡 儿 积 、 投 影 和 选择 是 5 种 基本 的 运算 ， 因 为 其 他 运算 可 以 通 


过 基本 的 运算 导出 。 
表 9-2 关系 代数 运算 符 
运算 符 ; 含 义 
和 大 于 
U > 大 于 等 了 
运 a 运 < 小 于 
nN < 小 于 等 可 
上 关 不 等 了 
更 
o 
专门 的 关 = 一 四 
系 运算 符 pa 忆 
算 V 或 
符 


9.3.2 5 种 基本 的 关系 代数 运算 
5 种 基本 的 关系 代数 运算 包括 并 、 差 、 笛 卡 儿 积 、 投 影 和 选择 ， 其 他 运算 可 以 通过 基本 的 
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关系 运算 导出 。 
1. 并 (Union) 
关系 RR 与 S$ 具 有 相同 的 关系 模式 ， 即 R 与 S 的 元 数 相 同 (结构 相同 )。 关 系 与 S 的 并 是 
由 属于 或 属于 5 的 元 组 构成 的 集合 ， 记 作 RUS ， 其 形式 定义 如 下 : 
RUS={tlteRvtes} 
式 中 1+ 为 元 组 变量 。 
2. 差 (Difference) 


关系 RR 与 S 具 有 相同 的 关系 模式 ， 关系 与 5 的 差 是 由 属于 RR 但 不 属于 5S 的 元 组 构成 的 
集合 ， 记 作 -S ， 其 形式 定义 如 下 : 
R-S={tlteRAt¢S} 
3. 广义 笛 卡 儿 积 〈Extended Cartesian Product) 


两 个 元 数 分 别 为 n 目 和 m 目的 关系 尺 和 8 的 广义 笛 卡 儿 积 是 一 个 (mtm) 列 的 元 组 的 集合 。 
元 组 的 前 n 列 是 关系 R 的 一 个 元 组 ， 后 m 列 是 关系 8 的 一 个 元 组 ， 记 作 RXS ， 其 形式 定义 
如 下 : 

RXS={t|t=<f",t" >At" eRAt” ES 

如 果 RR 和 S 中 有 相同 的 属性 名 , 可 在 属性 名 前 加 关系 名 作为 限定 ,以 示 区 别 。 若 及 有 大 个 
元 组 ，S 朋 ,个 元 组 ， 则 R 和 的 广义 笛 卡 儿 积 有 KK XKK, 个 元 组 。 

注意 : 本 教材 中 的 <7,t”> 意 为 元 组 "和 1" 拼接 成 的 一 个 元 组 。 

4. 投影 (Projection) 

投影 运算 是 从 关系 的 垂直 方向 进行 运算 , 在 关系 R 中 选 出 若干 属性 列 4 组 成 新 的 关系 , 记 
作 rs(R) ， 其 形式 定义 如 下 : 

Ta(R)= {A eR} 

S. 选择 (Selection) 

选择 运算 是 从 关系 的 水 平方 向 进行 运算 ， 是 从 关系 R 中 选择 满足 给 定 条 件 的 诸 元 组 ， 记 作 
ar(R) ， 其 形式 定义 如 下 : 

OF(R)={t|lte RAF(N)= True} 


其 中 , 五 中 的 运算 对 象 是 属性 名 (或 列 的 序号 ) 或 常数 ， 运 算 符 、 算 术 比 较 符 (<、 记 、>、 宇 、 
二 ) 和 邮 辑 运算 符 ( 入 、v 、 一 )。 例 如 ，oi>e(R) 表 示 选 取 尺 关系 中 第 1 个 属性 值 大 于 等 于 第 
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6 个 属性 值 的 元 组 ， oe.(R) 表示 选取 关系 中 第 1 个 属性 值 大 于 等 于 6 的 元 组 。 
【 例 9.4】 设 有 关系 R、S 如 下 所 示 , 请 求 出 RUS、R-S、RXS、mc(R)、o4ss(R) 和 
03 <4(RXS) es 


b 4 B C 
a b a d 
d d f g 
f h k 
关系 尺 关系 3 
解 RXS 、ruc(R) 、ai>s(R) 和 os<4(RXS) 的 结果 如 图 9-15 所 示 。 


d 

g 

k 

d 

g 

k 

d 

g 

k 

Tac(R) a d 
h k 


Ea 


Casa(R) 


图 9-15 运算 结果 
其 中 ，RXS 生成 的 关系 属性 名 有 重复 ， 按 照 关 系 “ 属 性 不 能 重 名 ”的 性 质 ， 通 常 采用 “关系 
名 .属性 名 ”的 格式 。 对 于 om .4(RXS) 的 含义 是 RXS 后 “选取 第 3 个 属性 值 小 于 第 4 个 属性 值 ” 


的 元 组 。 
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由 于 RXS 的 第 3 个 属性 为 R.C, 第 4 个 属性 是 SA, 因此 cs -4(RXS) 的 含义 也 是 好 XS 


后 “选取 R.C 值 小 于 S.A 值 ” 的 元 组 。 
9.3.3 扩展 的 关系 代数 运算 


扩展 的 关系 代数 运算 可 以 从 基本 的 关系 运算 中 导出 ， 主 要 包括 选择 、 投 影 、 连 接 、 除 法 、 
广义 笛 卡 儿 积 和 外 连接 。 


1. 交 (Intersection) 


关系 与 S 具 有 相同 的 关系 模式 ， 关系 与 5 的 交 是 由 属于 R 同 时 又 属于 S 的 元 组 构成 


的 集合 ， 


记 作 RNS， 其 形式 定义 如 下 : 
RMNS={tlteRAtesS} 


显然 ，RmnS=R-(R-S) ， 或 者 RS=S-(S-R) 。 
2. 连接 (Join) 


连接 分 为 6 连接 、 等 值 连接 和 自然 连接 3 种 。 连 接 运 算是 从 两 个 关系 和 S 的 笛 卡 儿 积 中 
选取 满足 条 件 的 元 组 。 因 此 ， 可 以 认为 箭 卡 儿 积 是 无 条 件 连接 ， 其 他 的 连接 操作 认为 是 有 条 件 
连接 ， 下 面 分 别 介绍 。 

(1) 9 连接。 从 RR 与 S 的 迄 卡 儿 积 中 选取 属性 间 满 足 一 定 条 件 的 元 组 。 记 作 : 


ReadS={t|t=<f",t” >At" eRAt™” eSAT[XIOFIY)} 
和 OF 


其 中 ，X67 为 连接 的 条 件 , 9 是 比较 运算 符 , 工 和 了 了 分别 为 尺 和 SS 上 度数 相等 且 可 比 的 属性 组 。 
1"[X] 表 示 RR 中 六 元 组 的 对 应 于 属性 于 的 一 个 分 量 。1"[ 刀 表示 S 中 让 元 组 的 对 应 于 属性 了 的 
一 个 分 量 。 有 如 下 说 明 。 

Q 8 连接 也 可 以 表示 为 : 


ReadS={t|t=<7",f” >At" ERAt” eSAt"[il07[))} 
igj 


其 中 ，i=1,2,3,…,n ，j=1,2,3,…,m，i9j 的 含义 为 从 两 个 关系 RR 和 S 中 选取 R 的 第 i 列 和 5 
的 第 j 列 之 间 满 足 9 运算 的 元 组 进行 连接 。 
@@ 6 连接 可 以 由 基本 的 关系 运算 箭 卡 儿 积 和 选取 运算 导出 。 因 此 ，8 连接 可 表示 为 : 


有 pqdS=axor(RXS) 或 ReqaS=aocnCRXS) 
OF igj 


【 例 9.5】 设 有 关系 RR、S 如 图 9-16 所 示 ， 求 ReaS 。 


RA<SB 
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解 : 本 题 连接 的 条 件 为 R.4<S.B， 意 为 将 尺 关 系 中 属性 4 的 值 小 于 S 关 系 中 属性 8 的 值 的 
元 组 取出 来 作为 结果 集 的 元 组 。 结 果 集 为 RXS 后 选 出 满足 条 件 的 元 组 ， 并 且 结 果 集 的 属性 为 
RA，R.B，R.C，S.A4，S.B，S.C。 结 果 如 图 9-16 所 示 。 


"mo 下 mo | 


oann oop pm 
~m moos ab ogo 
"mom mm a 
Ga mm mm 


图 9-16 ReasS 


RA<SB 


(2) 等 值 连接 。 当 9 为 “=” 时 ， 称 之 为 等 值 连接 ， 记 为 Rpa S ， 其 形式 定义 如 下 : 
X=Y 


ReAdS={|t=<7",1" >At" EeE RA ESAT[X]=7"[7)} 
X=Y 


(3) 自然 连接 。 自 然 连 接 是 一 种 特殊 的 等 值 连接 ， 它 要 求 两 个 关系 中 进行 比较 的 分 量 必须 
是 相同 的 属性 组 ， 并 且 在 结果 集中 将 重复 属性 列 去 掉 。 若 "表示 RR 关系 的 元 组 变量 ，1" 表示 5 
关系 的 元 组 变量 ;，R 和 S 具有 相同 的 属性 组 B， 且 B=(B,B,,…, Be) ; 并 假定 R 关 系 的 属性 为 
4,4,…, 轴 ,Bi,B,,…,Bx ，S 关 系 的 属性 为 B,B,,…, Bk,Bxw,Bx,,,…,B,; 为 S 的 元 组 变量 1” 
去 掉 重复 属性 B 所 组 成 的 新 的 元 组 变量 为 1”。 

自然 连接 可 以 记 为 Rpa Ss ， 其 形式 定义 如 下 : 

ReaS={|t=<t,1" >At" eRAt" ESARB =SBARB,=SB, NAARB, =SB 

自然 连接 可 以 由 基本 的 关系 运算 笛 卡 儿 积 和 选取 运算 导出 ， 因 此 自然 连接 可 表示 为 : 


9 Is. RS AR BS By AR BS Br (RX S)) 


需要 特别 说 明 的 是 ， 一般 连 接 是 从 关系 的 水 平方 向 运算 ,而 自然 连接 不 仅 要 从 关系 的 水 平 
方向 运算 ,而 且 要 从 关系 的 垂直 方向 运算 。 因 为 自然 连接 要 去 掉 重 复 属性 ， 如 果 没 有 重复 属性 ， 
那么 自然 连接 就 转化 为 笛 卡 儿 积 。 

【 例 9.6】 设 有 关系 R、S 如 图 9-17 所 示 ， 求 ReaS。 
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A B 3 4 内 D 
a b c 
a 必 d 
b a d i 
2 d e 国 了 5 
d g 
(a) 关系 R (b) 关系 S 


图 9-17 关系 R、5S 
解 : 本 题 要 求 R 与 8 关系 的 自然 连接 ， 自 然 连接 是 一 种 特殊 的 等 值 连接 ， 它 要 求 两 个 关系 
中 进行 比较 的 分 量 必 须 是 相同 的 属性 组 ,并且 在 结果 中 将 重复 属性 列 去 掉 。 本 题 R 与 S$ 关系 中 相 
同 的 属性 组 为 4C， 因 此 ， 结 果 集 中 的 属性 列 应 为 48CD， 其 结果 如 图 9-18 所 示 。 


图 9-18 RS 

3. 除 (Division) 

除 运算 是 同时 从 关系 的 水 平方 向 和 垂直 方向 进行 运算 。 给 定 关 系 R(X,Y) 和 S(Y,2Z)， 
于 、Y、2Z 为 属性 组 。 R=*S 应 当 满 足 元 组 在 让 上 的 分 量 值 x 的 象 集 ¥ 包含 关系 5 在 属性 组 了 上 
投影 的 集合 。 其 形式 定义 如 下 : 

RS={[X]|r eRAA,(S) CY.} 

其 中 ， 匡 为 x 在 R 中 的 象 集 ，x=w"[X]， 且 R=*S 的 结果 集 的 属性 组 为 。 

【 例 9.7】 设 有 关系 R、S 如 图 9-19 所 示 , 求 R+S。 


人 D A 
d a b | 
e f 各 k 
(a)R (b)s (c) RES 
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解 : 根据 除法 定义 ， 此 题 的 了 为 属性 4B, 了 为 属性 CD。R=S 应 当 满 足 元 组 在 属性 4B 上 
的 分 量 值 x 的 象 集 到 包含 关系 8 在 CD 上 投影 的 集合 。 

关系 5S 在 了 Y 上 的 投影 为 xcp(S)={(c,q),(e,f)}。 对 于 关系 R， 属 性 组 对 ( 即 4B) 可 以 取 3 
个 值 ， 即 {(a,5),(5,q),(e,D} ， 它 们 的 象 集 分 别 为 : 

象 集 CD.ss ={(c,q),(e,f),(h,£)} 

象 集 CD a) ={(e,f),(q,DN)} 

象 集 CDepb ={(c,q),(e,f)} 

由 于 上 述 象 集 包含 xcp(S) 有 (a, 5b) 和 (c, k)， 因此 RS={(a,b),(c, 且 }， 结果 如 图 9-19 (c) 
所 示 。 

【 例 9.8】 设 学 生 课程 数据 库 中 有 学 生 S、 课 程 C 和 学 生 选 课 SC 这 3 个 关系 ， 如 图 9-20 
所 示 ， 请 用 关系 代数 表达 式 表达 以 下 检索 问题 。 


软件 学 院 
电子 机 械 
电子 机 械 
通信 工程 


通信 工程 


1 3 1 
2 4 2 
3 操作 系统 4 4 3001 3 84 
4 数据 结构 7 3 3002 2 83 
5 数字 通信 6 EE 3002 EE 93 
6 信息 系统 1 4 1042 1 84 
7 程序 设计 2 1042 3 82 
还 Se 


图 9-20 S、C、SC 关系 


(1) 检索 选修 课程 名 为 “数学 ”的 学 生 的 学 号 和 姓名 。 
(2) 检索 至 少 选 修了 课程 号 为 1 和 3 的 学 生 的 学 号 。 
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(3) 检索 选修 了 “操作 系统 ”或 “数据 库 ” 课 程 的 学 生 的 学 号 和 姓名 。 

(4) 检索 年 龄 在 18 一 20 之 间 ( 含 18 和 20) 的 女生 的 学 号 、 姓 名 及 年 龄 。 

(5) 检索 选修 了 “数据 库 ” 课 程 的 学 生 的 学 号 、 姓 名 及 成 绩 。 

(6) 检索 选修 了 全 部 课程 的 学 生 的 姓名 所 在 系 。 

(7) 检索 选修 课程 包括 1042 学 生 所 学 课程 的 学 生 的 学 号 。 

(8) 检索 不 选修 2 课程 的 学 生 的 姓名 和 所 在 系 。 

解 : (1) 检索 选修 课程 名 为 “数学 ”的 学 生 的 学 号 和 姓名 的 关系 代数 表达 式 如 下 。 

spo,sname (CEaame-as#'(S PdSC PdC) ) 或 而 (Cs-g# (Spa SC pa CO)) 

对 于 上 述 表 达 式 S pa SC pa C 自然 连接 后 重复 的 属性 列 为 学 号 Sno 和 课程 号 Cno， 去 掉 重 
复 属性 列 的 结果 如 图 9-21 所 示 。 从 图 中 可 以 看 到 ， 满 足 课程 名 为 “数学 ”的 只 有 3 个 元 组 ， 对 
Sno 和 Sname 投影 的 结果 如 图 9-22 所 示 。 由 于 Sno、Cno 和 Cname 分 别 对 应 第 1、2 和 8 列 属 
性 ， 所 以 上 述 表 达 式 还 可 以 写 为 mn, (as-gs#(S pq SC pq C ))。 


通信 工程 
通信 工程 


图 9-21 SSCC 


(2) 检索 至 少 选修 了 课程 号 为 1 和 3 的 学 生 的 学 号 有 以 下 两 种 解 
题 思路 。 

@ 关系 代数 表达 式 为 三 (a_4 -assa(SCXSC)) 。 若 设 SCXSC 中 
的 第 一 个 SC 关系 为 S1， 第 二 个 SC 关系 为 S2， 那 么 ， 该 关系 表达 式 
的 含义 为 先 从 SCXSC 中 选取 满足 条 件 S1.Sno=S2.Sno、S1.Cno='1'、 


图 9-22 例 9.8 
S2.Sno='3' 的 元 组 ， 最 后 投影 第 一 个 属性 列 Sno 即 为 所 求 结 果 集 。 的 投影 结果 
加 关系 代数 表达 式 为 Tsno cno(SC) + Tcno(Ccno-tvcno-s'(C)) ， 分 析 


如 下 。 
表达 式 rcno (acno-avcno-s'(C)) 就 是 构造 一 个 临时 关系 天 ， 其 属性 为 Cno， 结 果 如 下 : 


K = Teao(Ccao-avcao-s'(C) = {1,3} 
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查询 表达 式 xs。cno(SC)* 天 的 结果 集 的 学 生 号 所 选 的 课程 号 应 包括 天。 

求解 的 过 程 就 是 对 rsno cao(SC) 的 每 一 个 元 组 逐一 求 某 一 学 生 的 象 集 。 因 为 所 求 的 Sno， 所 
以 和 为 Sno，Y 为 Cno， 所 以 象 集 为 Cnos。。 将 Sno 的 值 逐 一 代入 求 象 集 : 

Cnoso01 ={1,2,3} ， Cno300 = 12,3} ， Cnoios ={1,2} 
从 上 可 以 看 出 ， 只 有 3001 包含 了 天 在 Cno 的 投影 ， 所 以 ， rsnoeuo(SC)= 天 = {3001} 。 
(3) 检索 选修 了 “操作 系统 ”或 “数据 库 ” 课程 的 学 生 的 学 号 和 姓名 的 关系 代数 表达 式 为 : 
TUsno Sname ( S Pd ( CEname- 则 作 和 统 , V Cname= 路 所 序 (SC Pd C) )) 
(4) 检索 年 龄 在 18 一 20 之 间 〈 含 18 和 20) 的 女生 的 学 号 、 姓 名 及 年 龄 的 关系 代数 表达 
式 为 : 
Tsno sname Age (OAge>"18'AAge<'20'Sex=' 女 '(S)) 
(5) 检索 选修 了 “数据 库 ” 课 程 的 学 生 的 学 号 、 姓 名 及 成 绩 的 关系 代数 表达 式 为 : 
spo sname.Grade ((Gcname- gg (S PA SC pa C))) 
(6) 检索 选修 了 全 部 课程 的 学 生 的 姓名 及 所 在 系 的 关系 代数 表达 式 为 : 
Nsname sp (S P< (Tsno.cao (SC) + Ncno (OC))) 

对 于 本 题 给 出 的 具体 关系 ,求解 过 程 分 析 如 下 。 

@ 表示 全 部 课程 的 临时 关系 天 = rcuo(C) = 人 L2.3,4.5,6,7} 。 

@ 查询 选修 了 所 有 课程 的 学 生 的 学 号 为 rsnocuo(SC) = 天 = {内 ， 因 为 学 生 所 选课 程 分 别 为 
Cnoso0 = 册 ,2,3} 、Cnoiom = {2,3} 和 Cnoiot =fL,2} ， 所 以 3001、3002 和 1042 都 没有 包含 天 ， 
故 结果 集 为 空 。 

@ 与 5 关系 进行 自然 连接 再 对 学 生 姓名 Sname 和 学 号 SD 投影 的 结果 也 为 空 。 

(7) 检索 选修 课程 包含 1042 学 生 所 学 课程 的 学 生 的 学 号 的 关系 表达 式 如 下 : 

Tsno cno(SC) = Tcnao (Gsno-n042' (SC)) 
(8) 检索 不 选修 2 课程 的 学 生 的 姓名 和 所 在 系 的 关系 代数 表达 式 为 : 
Tsname sD (SC) 一 rsmamesp (acao-z(SXSC)) 


对 于 上 式 也 可 以 用 属性 列 号 替换 属性 名 ,将 上 式 写 成 以 下 等 价 的 关系 代数 表达 式 : 
Ta(SC) -Naoe(S Pa SO)) 


4. 广义 投影 (Generalized Projection) 


广义 投影 运算 允许 在 投影 列表 中 使 用 算术 运算 ， 实 现 了 对 投影 运算 的 扩充 。 
若 有 关系 R， 条 件 五 , 互 ,…, 五 ,中 的 每 一 个 都 是 涉及 R 中 常量 和 属性 的 算术 表达 式 ， 那 么 广 
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义 投影 运算 的 形式 定义 为 : zn 5,(R) 。 

【 例 9.9】 信贷 额度 关系 模式 creditin (C_name, limit, credit balance) ， 属 性 分 别 表示 用 户 
姓名 、 信 贷 额 度 和 到 目前 为 止 的 花费 。 图 9-23 (a) 表示 了 关系 credit-in 的 一 个 具体 。 若 要 查询 
给 出 每 个 用 户 还 能 花费 多 少 ， 可 以 用 关系 代数 表达 式 rc namelimiteredit balance (credit -in) 来 表示 ， 查 
询 结果 如 图 9-23 (b) 所 示 。 


C name limit 一 credit_ balance 
王 伟 峰 700 


(a) credit—in (b) rc namelimt-credit balance (Credit —in) 
图 9-23 ”信贷 额度 关系 
5. 外 连接 (Outer Jion) 


外 连接 运算 是 连接 运算 的 扩展 ， 可 以 处 理由 于 连接 运算 而 缺失 的 信息 。 对 于 图 9-20 所 示 
的 S 和 SC 关系 ， 当 对 其 进行 自然 连接 S ea SC 时， 其 结果 如 图 9-24 所 示 。 


软件 学 院 
软件 学 院 
软件 学 院 
软件 学 院 


3002 | 张 勇 | 软件 学 院 
1042 | 樊 建 簿 | 通信 工程 | 20 | 
1042 | 樊 建 簿 | 通信 工程 | 20 | 


图 9-24 SmaSC 
从 图 9-24 可 以 看 出 ，S 与 SC 的 自然 连接 S pa SC 的 结果 丢失 了 黎明 、 刘 明 远 、 赵 国庆 的 
相关 信息 。 但 是 ， 使 用 外 连接 可 以 避免 这 样 的 信息 丢失 。 外 连接 运算 有 3 种 ， 即 左 外 连接 、 厂 
外 连接 和 全 外 连接 。 
(1) 左 外 连接 (Left Outer Jion) 了 4。 取 出 左 侧 关系 中 所 有 与 右 侧 关系 中 任 一 元 组 都 不 匹 
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配 的 元 组 ， 用 空 值 null 充填 所 有 来 自 右 侧 关 系 的 属性 ， 构 成 新 的 元 组 ， 将 其 加 入 自然 连接 的 
结果 中 。 对 于 图 9-20 所 示 的 S 和 SC 关系 ， 当 对 其 进行 左 外 连接 SP SC 时 ， 其 结果 如 图 9-25 


所 示 。 
Sno Sname Sex sD Age Cno Grade 
3001 E 女 软件 学 院 18 1 93 
3001 村 符 | 女 | 软件 学 院 | 18 | 区 84 
3001 至 时 | 女 软件 学 院 18 3 84 
3002 张 勇 男 软件 学 院 19 2 83 
3002 张 勇 男 软件 学 院 19 3 93 
4003 黎明 女 电子 机 械 18 null null 


4004 刘 明 远 男 电子 机 械 19 null null 


1041 赵 国 庆 男 通信 工程 20 null null 
1042 枢 建 条 男 通信 工程 20 1 84 
1042 侈 建 往 男 通信 工程 20 4 82 


图 9-25 SJxdsc 
(2) 右 外 连接 (Right Outer Jion) [xC。 取 出 右 侧 关系 中 所 有 与 左 侧 关系 中 任 一 元 组 都 不 匹 


配 的 元 组 ， 用 空 值 null 填充 所 有 来 自 左 侧 关系 的 属性 ， 构 成 新 的 元 组 ， 将 其 加 入 自然 连接 的 结 
果 中 。 对 于 图 9-20 所 示 关 系 SC 和 C， 当 进行 右 外 连接 SCIXLC 时 ， 其 结果 如 图 9-26 所 示 。 
数据 库 3 
3001 和 84 数学 4 
3001 3 84 操作 系统 4 4 
3002 区 83 | 数学 4 
3002 3 93 | 操作 系统 | 4 4 
1042 1 84 “| 数据 库 E 学 
1042 2 | 8 | 数学 | 4 
null | 4 | null | 数据 结构 学 | 3 
null 5 | mm | 数字 通信 | 6 | 3 
null | 6 | null | 信息 系统 | | | 4 
null 7 null 程序 设计 2 2 


图 9-26 SC [x[Cc 
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(3) 全 外 连接 (Full Outer Jion) XL。 完 成 左 外 连接 和 右 外 连接 的 操作 。 即 填充 左 侧 关系 
中 所 有 与 右 侧 关系 中 任 一 元 组 都 不 匹配 的 元 组 ， 并 填充 右 侧 关系 中 所 有 与 左 侧 关系 中 任 一 元 组 
都 不 匹配 的 元 组 ， 将 产生 的 新 元 组 加 入 自然 连接 的 结果 中 。 

【 例 9.10】 设 有 关系 R、S 如 图 9-27 所 示 ， 求 RJxS、RIxCS 和 RJxCS。 


(a) 关系 及 (b) 关系 S 
图 9-27 关系 R、S 


对 于 图 9-27 所 示 的 R、S 关系 ， 当 对 其 进行 左 外 连接 RJxIS， 右 外 连接 RIKLS， 全 外 连接 
RJXLS 时 ， 其 结果 分 别 如 图 9-28 (a)、 图 9-28 (b) 和 图 9-28 (c) 所 示 。 


(a) 左 外 连接 R 了 4 S (b) 右 外 连接 R DE S (c) 全 外 连接 R PE S 
图 9-28 RJxS、RIxCs 和 RPES 


9.4 关系 数据 库 SQL 语言 简介 


SQL (Structured Query Language) 早已 确立 起 自己 作为 关系 数据 库 标 准 语言 的 地 位 ， 已 被 
众多 商用 DBMS 产品 (如 DB2、ORACLE、INGRES、SYSBASE、SQL Server 和 VFP 等 ) 所 
采用 ,使 得 它 已 成 为 关系 数据 库 领 域 中 的 一 个 主流 语言 SQL 是 在 1974 年 由 Boyce 和 Chamberlin 
提出 的 , 它 是 关系 数据 库 中 最 普遍 使 用 的 语言 ,包括 数据 查询 (Query)、 数 据 操纵 (Manipulation)、 
数据 定义 (Definition) 和 数据 控制 《Control) 功能 ， 是 一 种 通用 的 、 功 能 强大 的 关系 数据 库 的 
标准 语言 。 


EE 
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9.4.1 SQL 数据 库 体 系 结构 


SQL 主要 有 3 个 标准 : ANSI (美国 国家 标准 机 构 ) SQL; 对 ANSI SQL 进行 修改 后 在 1992 
年 采用 的 标准 SQL-92 或 SQL2; 最 近 的 SQL-99 标准 ， 也 称 为 SQL3 标准 。SQL-99 从 SQL-92 
扩充 而 来 ， 并 增加 了 对 象 关 系 特征 和 许多 其 他 新 的 功能 。 


1. SQL 的 特点 


SQL 的 特点 如 下 。 

(1) 综合 统一 。 非 关系 模型 的 数据 语言 分 为 模式 定义 语言 和 数据 操纵 语言 ， 其 缺点 是 当 要 
修改 模式 时 ， 必 须 停 止 现 有 数据 库 的 运行 ， 转 储 数据 ， 修 改 模式 编译 后 再 重 装 数据 库 。SQL 集 
数据 定义 、 数 据 操纵 和 数据 控制 功能 于 一 体 ， 语 言 风 格 统一 ， 可 独立 完成 数据 库 生命 周期 的 所 
有 活动 。 

(2) 高 度 非 过 程 化 。 非 关系 数据 模型 的 数据 操纵 语言 是 面向 过 程 的 ， 若 要 完成 某 项 请 求 ， 
必须 指定 存储 路 径 ; 而 SQL 语言 是 高 度 非 过 程 化 语言 , 当 进 行 数据 操作 时 , 只 要 指出 “做 什么 ”， 
无 须 指 出 “怎么 做 ”， 存 储 路 径 对 用 户 来 说 是 透明 的 ， 提 高 了 数据 的 独立 性 。 

(3) 面向 集合 的 操作 方式 。 非 关系 数据 模型 采用 的 是 面向 记录 的 操作 方式 ， 操 作对 象 是 一 
条 记录 。 而 SQL 语言 采用 面向 集合 的 操作 方式 ， 其 操作 对 象 、 查 找 结果 可 以 是 元 组 的 集合 。 

(4) 两 种 使 用 方式 。 第 一 种 方式 ， 用 户 可 以 在 终端 键盘 上 输入 SQL 命令 ， 对 数据 库 进行 
操作 ， 故 称 之 为 自 含 式 语言 ; 第 二 种 方式 , 将 SQL 语言 嵌入 到 高 级 语言 程序 中 ， 所 以 又 称 为 嵌 
入 式 语言 。 

(5) 语言 简洁 、 易 学 易 用 。SQL 语言 功能 极 强 ， 完 成 核心 功能 只 用 了 9 个 动词 ， 包 括 以 下 
4 类 。 


数据 查询 : SELECT。 

数据 定义 : CREATE、DROP、ALTER。 
数据 操纵 : INSERT、UPDATE、DELETE。 
数据 控制 : GRANT、REVORK。 


2. SQL 支持 三 级 模式 结构 


SQL 语言 支持 关系 数据 库 的 三 级 模式 结构 ， 其 中 ， 视 图 对 应 外 模式 、 基 本 表 对 应 模式 、 存 
储 文件 对 应 内 模式 。 具 体 结构 如 图 9-29 所 示 。 


9.4.2 ”SQL 的 基本 组 成 
SQL 由 以 下 几 个 部 分 组 成 。 
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外 模式 


View (视图 ) 1 View (视图 ) 2 


Base Table 3 
(基本 表 ) 


Base Table4 
(基本 表 ) 


Base Table2 
(基本 表 ) 


Base Table 1 
(基本 表 ) 


一 一 一 模式 


Sored File 1 Sored File 2 Sored File 3 内 模式 


(存储 文件 ) (存储 文件 ) (存储 文件 ) 


图 9-29 关系 数据 库 的 三 级 模式 结构 


(1) 数据 定义 语言 。SQL DDL 提供 定义 关系 模式 和 视图 、 删 除 关系 和 视图 、 修 改 关 系 模 
式 的 命令 。 

(2) 交互 式 数据 操纵 语言 。SQL DML 提供 查询 、 插 入 、 删 除 和 修改 的 命令 。 

(3) 事务 控制 (Transaction Control)。SQL 提供 定义 事务 开始 和 结束 的 命令 。 

(4) 人 嵌入 式 SQL 和 动态 SQL (Embeded SQL and Dynamic SQL )。 用 于 嵌入 到 某 种 通用 的 
高 级 语言 《C、C++、Java、PLI、COBOL 和 VB 等 ) 中 混合 编程 。 其 中 ，SQL 负责 操纵 数据 
库 ， 高 级 语言 负责 控制 程序 流程 。 

(5) 完整 性 (Integrity)。SQL DDL 包括 定义 数据 库 中 的 数据 必须 满足 的 完整 性 约束 条 件 
的 命令 ， 对 于 破坏 完整 性 约束 条 件 的 更 新 将 被 禁止。 

(6) 权限 管理 (Authorization)。SQL DDL 中 包括 说 明 对 关系 和 视图 的 访问 权限 。 


9.4.3 SQL 数据 定义 


基本 表 和 视图 都 是 表 ， 所 不 同 的 是 基本 表 是 实际 存储 在 数据 库 中 的 表 ， 视 图 是 虚 表 ， 是 从 
基本 表 或 其 他 视图 中 导出 的 表 。 数据 库 中 只 存放 视图 的 定义 , 不 存放 视图 的 数据 用户 可 用 SQL 
语句 对 基本 表 和 视图 进行 查询 等 操作 ， 在 用 户 看 来 ， 基 本 表 和 视图 一 样 ， 都 是 关系 〈 即 表 )。 
一 个 基本 表 可 以 存储 在 一 个 或 多 个 存储 文件 中 ， 一 个 存储 文件 也 可 以 存储 一 个 或 多 个 基本 表 。 
一 个 表 可 以 带 若干 索 引 ， 索 引 也 存储 在 存储 文件 中 。 每 个 存储 文件 就 是 外 部 存储 器 上 的 一 个 物 
理 文件 ， 存 储 文件 的 逻辑 结构 组 成 了 关系 数据 库 的 内 模式 。 
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SQL 的 数据 定义 包括 对 表 、 视 图 、 索 引 的 创建 和 删除 。 
1. 创建 表 (CREATE TABLE) 


语句 格式 : CREATE TABLE < 表 名 >(< 列 名 >< 数 据 类 型 >[ 列 级 完整 性 约束 条 件 ] 
[; < 列 名 >< 数 据 类 型 >[ 列 级 完整 性 约束 条 件 ]]… 
[, < 表 级 完整 性 约束 条 件 >]); 


列 级 完整 性 约束 条 件 有 NULL ( 空 ) 和 UNIQUE ( 取 值 唯一 )， 如 NOTNULL UNIQUE 表 
示 取 值 唯一 ， 不 能 取 空 值 。 

【 例 9.11】 建立 一 个 供应 商 、 零 件数 据 库 。 其 中 ,“ 供 应 商 ” 表 S (Sno，Sname，Status， 
City) 分 别 表 示 供 应 商 代 码 、 供 应 商 名 、 供 应 商 状态 和 供应 商 所 在 城市 “零件 ” 表 P (Pno， 
Pname，Color，Weight，City) 表示 零件 号 、 零 件 名 、 颜 色 、 重 量 及 产地 。 数 据 库 要 满足 以 下 
要 求 。 

(1) 供应 商 代码 不 能 为 室 ， 且 值 是 唯一 的 ， 供 应 商 的 名 也 是 唯一 的 。 

(2) 零件 号 不 能 为 室 ， 且 值 是 唯一 的 ;零件 名 不 能 为 空 。 

(3) 一 个 供应 商 可 以 供应 多 个 零件 ， 而 一 个 零件 可 以 由 多 个 供应 商 供应 。 

分 析 : 根据 题 意 ， 供 应 商 和 零件 分 别 要 建立 一 个 关系 模式 。 供 应 商 和 零件 之 间 是 一 个 多 对 
多 的 联系 ， 在 关系 数据 库 中 ， 多 对 多 联系 必须 生成 一 个 关系 模式 ， 而 该 模式 的 码 是 该 联系 两 端 
实体 的 码 加 上 联系 的 属性 构成 的 ， 若 该 联系 名 为 SP， 那么 关系 模式 为 SP (Sno, Pno, Qty)， 其 
中 ，Qty 表示 零件 的 数量 。 

根据 上 述 分 析 ， 用 SQL 建立 一 个 供应 商 、 零 件数 据 库 如 下 : 

CREATE TABLE S( Sno CHAR(S)NOTNULL UNIQUE, 

Sname CHAR(30) UNIQUE, 
Status CHAR(8), 
City CHAR(20) 
PRIMARY KEY(Sno)); 
CREATE TABLE P(Pno CHAR(O), 
Pname CHAR(30) NOT NULL., 
Color CHAR(8) . 
Weight NUMERIC(6.2)， 
City CHAR(20) 
PRIMARY KEY(Pno)); 
CREATE TABLE SP( Sno CHAR(5). 
Pno CHAR(6)， 
Status CHAR(8), 


第 9 章 数据 库 技术 基础 “ 胃 493 攻 


Qty NUMERIC(9)， 

PRIMARY KEY(Sno.Pno)， 

FOREIGN KEY(Sno) REFERENCES S(Sno)， 
FOREIGN KEY(Pno) REFERENCES P(Pno)): 


从 上 述 定 义 可 以 看 出 , Sno CHAR(5) NOT NULL UNIQUE 语句 定义 了 Sno 的 列 级 完整 性 约 
束 条 件 ， 取 值 唯一 ， 不 能 取 空 值 。 

需要 说 明 如 下 。 

(1)PRIMARY KEY(Sno) 已 经 定义 了 Sno 为 主 码 , 所 以 Sno CHAR(5) NOT NULL UNIQUE 
语句 中 的 NOTNULL UNIQUE 可 以 省 略 。 

(2) FOREIGN KEY(Sno) REFERENCES S(Sno) 定 义 了 在 SP 关系 中 Sno 为 外 码 ， 其 取 值 必 
须 来 自 S 关系 的 Sno 域 。 同 理 ， 在 SP 关系 中 Pno 也 定义 为 外 码 。 

2. 修改 和 删除 表 

1) 修改 表 (ALTER TABLE) 

语句 格式 : ALTER TABLE < 表 名 >[ADD< 新 列 名 >< 数 据 类 型 >[ 完 整 性 约束 条 件 ]] 


[DROP< 完 整 性 约束 名 >] 
[MODIFY < 列 名 >< 数 据 类 型 >]; 


例如 ， 向 “供应 商 ” 表 5 增加 Zap“ 邮 政 编码 ”可 用 如 下 语句 : 
ALTER TABLE SADD Zap CHAR(6): 


注意 : 不 论 基本 表 中 原来 是 否 已 有 数据 ， 新 增加 的 列 一 律 为 空 。 

又 如 ， 将 Status 字段 改 为 整 型 可 用 如 下 语句 : 

ALIER TABLE S MODIFY Status INT:; 

2) 删除 表 (DROP TABLE) 

语句 格式 : DROP TABLE < 表 名 > 

例如 执行 DROP TABLE Student， 此 后 关系 Student 不 再 是 数据 库 模 式 的 一 部 分 ， 关 系 中 的 
元 组 也 无 法 访问 。 

3. 索引 建立 与 删除 


数据 库 中 的 索引 与 书籍 中 的 索引 类 似 ， 在 一 本 书 中 ， 利 用 索引 可 以 快速 地 查找 所 需 信息 ， 
而 无 须 阅 读 整 本 书 。 在 数据 库 中 ， 索 引 使 数据 库 程 序 无 须 对 整个 表 进行 扫描 ， 就 可 以 在 其 中 找 
到 所 需 数据 。 书 中 的 索引 是 一 个 词语 列表 ， 其 中 注 明 了 包含 各 个 词 的 页 码 。 而 数据 库 中 的 索引 
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是 某 个 表 中 一 列 或 者 若干 列 值 的 集合 和 相应 的 指向 表 中 物理 标识 这 些 值 的 数据 页 的 逻辑 指针 
清单 。 索 引 的 作用 如 下 。 

(1) 通过 创建 唯一 索引 ， 可 以 保证 数据 记录 的 唯一 性 。 

(2) 可 以 大 大 加 快 数据 的 检索 速度 。 

(3) 可 以 加 速 表 与 表 之 间 的 连接 ， 这 一 点 在 实现 数据 的 参照 完整 性 方面 有 特别 的 意义 。 

(4) 在 使 用 ORDER BY 和 GROUP BY 子 句 中 进行 检索 数据 时 ， 可 以 显著 减少 查询 中 分 组 
和 排序 的 时 间 。 

(5) 使 用 索引 可 以 在 检索 数据 的 过 程 中 使 用 优化 隐藏 器 ， 提 高 系统 性 能 。 

索引 分 为 聚集 索引 和 非 聚集 索引 。 聚 集 索引 是 指 索引 表 中 索引 项 的 顺序 与 表 中 记录 的 物理 
顺序 一 致 的 索引 。 

1) 建立 索引 

语句 格式 : CREATE [UNIQUE][CLUSTER]INDEX < 索引 名 > 

ON < 表 名 >(< 列 名 >[< 次 序 >][,< 列 名 >[< 次 序 >]]…); 

参数 说 明 如 下 。 

。 次序 : 可 选 ASC (升序 ) 或 DSC〈 降 序 )， 默 认 值 为 ASC。 

。 UNIQUE: 表明 此 索引 的 每 一 个 索引 值 只 对 应 唯一 的 数据 记录 。 

。 CLUSTER: 表明 要 建立 的 索引 是 聚 簇 索引 , 意 为 索引 项 的 顺序 是 与 表 中 记录 的 物理 顺 

序 一 致 的 索引 组 织 。 

【 例 9.12】 假设 供应 销售 数据 库 中 有 供应 商 S、 零 件 P、 工 程 项 目 芽 供销 情况 SPJ 关系 ， 
希望 建立 4 个 索引 。 其 中 ， 供 应 商 S 中 Sno 按 升 序 建立 索引 ; 零件 P 中 Pno 按 升序 建立 索引 ， 
工程 项 目 J 了 中 Jno 按 升 序 建立 索引 ; 供销 情况 SPJ 中 Sno 按 升 序 、Pno 按 降 序 、Jno 按 升 序 建立 
索引 。 

解 : 根据 题 意 建立 的 索引 如 下 。 

CREATE UNIQUE INDEX S-SNO ON S(Sno): 

CREATE UNIQUE INDEX P-PNO ON P(Pno): 


CREATE UNIQUE INDEX J-JNO ON J(Jno): 
CREATE UNIQUE INDEX SPJ-NO ON SPJ(Sno ASC.Pno DESC.JNO ASC): 


2) 删除 索引 

语句 格式 : DROP INDEX < 索引 名 > 

例如 执行 DROP INDEX Studentmdex， 此 后 索引 StudentIndex 不 再 是 数据 库 模 式 的 一 
部 分 。 
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4. 视图 创建 与 删除 


视图 是 从 一 个 或 者 多 个 基本 表 或 视图 中 导出 的 表 , 其 结构 和 数据 是 建立 在 对 表 的 查询 基础 
上 的 。 和 真实 的 表 一 样 ， 视 图 也 包括 几 个 被 定义 的 数据 列 和 多 个 数据 行 ， 但 从 本 质 上 讲 ， 这 些 
数据 列 和 数据 行 来 源 于 其 所 引用 的 表 。 因 此 ， 视 图 不 是 真实 存在 的 基本 表 ， 而 是 一 个 虚拟 表 ， 
视图 所 对 应 的 数据 并 不 实际 地 以 视图 结构 存储 在 数据 库 中 ， 而 是 存储 在 视图 所 引用 的 表 中 。 使 
用 视图 的 优点 和 作用 如 下 。 
(1) 可 以 使 用 视图 集中 数据 、 简 化 和 定制 不 同 用 户 对 数据 库 的 不 同 数据 要 求 。 
(2) 使 用 视图 可 以 屏蔽 数据 的 复杂 性 ， 用 户 不 必 了 解数 据 库 的 结构 ， 就 可 以 方便 地 使 用 和 
管理 数据 ， 简 化 数据 权限 管理 和 重新 组 织 数据 以 便 输 出 到 其 他 应 用 程序 中 。 
(3) 视图 可 以 使 用 户 只 关心 他 感 兴趣 的 某 些 特定 数据 和 他 们 所 负责 的 特定 任务 ， 而 那些 不 
需要 的 或 者 无 用 的 数据 则 不 在 视图 中 显示 。 
(4) 视图 大 大 地 简化 了 用 户 对 数据 的 操作 。 
(5) 视图 可 以 让 不 同 的 用 户 以 不 同 的 方式 看 到 不 同 或 者 相同 的 数据 集 。 
(6) 在 某 些 情况 下 , 由 于 表 中 数据 量 太 大 , 因此 在 设计 表 时 常 将 表 进行 水 平 或 者 垂直 分 割 ， 
以 免 表 的 结构 的 变化 对 应 用 程序 产生 不 良 的 影响 。 
(7) 视图 提供 了 一 个 简单 而 有 效 的 安全 机 制 。 
1) 视图 的 创建 
语句 格式 : CREATE VIEW 视图 名 (列表 名 ) 
AS SELECT 查询 子 句 
[WITH CHECK OPTION]: 


注意 : 在 视图 的 创建 中 必须 遵循 以 下 规定 。 

(1) 子 查 询 可 以 是 任意 复杂 的 SELECT 语句 ， 但 通常 不 允许 含有 ORDER BY 子 句 和 
DISTINCT 短语 。 

(2) WITH CHECK OPTION 表示 对 UPDATE、INSERT、DELETE 操作 时 保证 更 新 、 插 入 
或 删除 的 行 满足 视图 定义 中 的 谓词 条 件 〈 即 子 查 询 中 的 条 件 表达 式 )。 

(3) 组 成 视图 的 属性 列 名 或 者 全 部 省 略 或 者 全 部 指定 。 如 果 省 略 属 性 列 名 ， 则 隐 含 该 视图 
由 SELECT 子 查询 目标 列 的 主 属性 组 成 。 

【 例 9.13】 若 学 生 关 系 模式 为 Student (Sno,Sname,Sage,Sex,SD,Email,Tel)， 建 立 “ 计 算 机 
系 ”(CS 表示 计算 机 系 ) 学 生 的 视图 ， 并 要 求 进行 修改 、 插 入 操作 时 保证 该 视图 中 只 有 计算 机 
系 的 学 生 。 


CREATE VIEW CS-STUDENT 
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AS SELECT Sno,Sname,Sage,Sex 
FROM Student 

WHERE SD='CS' 

WITH CHECK OPTION:; 


由 于 CS-STUDENT 视图 使 用 了 WITH CHECK OPTION 子 句 ， 因 此 ， 对 该 视图 进行 修改 、 
插入 操作 时 DBMS 会 自动 加 上 SD='CS' 的 条 件 ， 保 证 该 视图 中 只 有 计算 机 系 的 学 生 。 

2) 视图 的 删除 

语句 格式 : DROP VIEW 视图 名 

例如 ，DROP VIEW CS-STUDENT 将 删除 视图 CS-STUDENT。 


9.4.4 ”SQL 数据 查询 


SQL 的 数据 操纵 功能 包括 SELECT (查询 )、INSERT (插入 ) DELETE (删除 ) 和 UPDATE 
(修改 ) 这 4 条 语句 。SQL 语言 对 数据 库 的 操作 十 分 灵活 、 方 便 ， 原 因 在 于 SELECT 语句 中 成 
分 丰富 多 样 的 元 组 ， 有 许多 可 选 形式 ， 尤 其 是 目标 列 和 条 件 表 达 式 。 

本 小 节 数 据 查 询 以 图 9-20 所 示 的 学 生 选 课 数据 库 为 例 。 


1. SELECT 基本 结构 


数据 库 查 询 是 数据 库 的 核心 操作 ，SQL 语言 提供 了 SELECT 语句 进行 数据 库 的 查询 。 
语句 格式 : SELECT [ALLIDISTINCT]< 目 标 列表 达 式 >[,< 目 标 列表 达 式 >]… 

FROM < 表 名 或 视图 名 >[,< 表 名 或 视图 名 >] 

[WHERE < 条 件 表达 式 >] 

[GROUP BY < 列 名 1>[HAVING< 条 件 表达 式 >]] 

[ORDER BY < 列 名 2>[ASCIDESC]…] 


SQL 查询 中 的 子 句 顺序 为 SELECT、FROM、WHERE、GROUP BY、HAVING 和 ORDER 
BY。 其 中 ，SELECT、FROM 是 必需 的 ，HAVING 条 件 子 句 只 能 与 GROUP BY 搭配 起 来 使 用 。 

(1) SELECT 子 句 对 应 的 是 关系 代数 中 的 投影 运算 ， 用 来 列 出 查询 结果 中 的 属性 。 其 输出 
可 以 是 列 名 、 表 达 式 、 集 函数 (AVG、COUNT、MAX、MIN、SUM)，DISTINCT 选项 可 以 保 
证 查询 的 结果 集中 不 存在 重复 元 组 。 

(2) FROM 子 句 对 应 的 是 关系 代数 中 的 笛 卡 儿 积 ， 它 列 出 的 是 表达 式 求 值 过 程 中 需 扫描 的 
关系 ， 即 在 FROM 子 句 中 出 现 多 个 基本 表 或 视图 时 ， 系 统 首 先 执行 笛 卡 儿 积 操 作 。 

(3) WHERE 子 句 对 应 的 是 关系 代数 中 的 选择 谓词 。WHERE 子 句 的 条 件 表达 式 中 可 以 使 
用 的 运算 符 如 表 9-3 所 示 。 
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表 9-3 WHERE 子 句 的 条 件 表达 式 中 可 以 使 用 的 运算 符 


运 算 符 售 ， 交 运 算 符 党 ”这 
| 在 集合 > S 
网 册 在 侍 全 本 

运算 符 | NOT IN 不 在 集合 i 小 于 
字符 串 与 和 % 进 行 i 小 于 等 于 
匹配 运 | LIKE 单个 、 多 个 = 等 于 
算 符 字符 匹配 等 于 
空 值 有 AND 与 

为 空 

比较 。 | 袜 R 5 逻辑 运算 符 | oR 或 

Sl IS NOT NULL 不 能 为 空 

运算 符 NOT 非 


一 个 典型 的 SQL 查询 具有 以 下 形式 : 
SELECT A,A,,…,A, 

FROM 1,b,--, 

WHERE Pp 


对 应 关系 代数 表达 式 为 ITIL (Cp (i Xn XX )) 。 
2. 简单 查询 


SQL 最 简单 的 查询 是 找 出 关系 中 满足 特定 条 件 的 元 组 , 这 些 查 询 与 关系 代数 中 的 选择 操作 
类 似 。 简 单 查询 只 需要 使 用 3 个 保留 字 ， 即 SELECT、FROM 和 WHERE。 
【 例 9.14】 查询 学 生 -课程 数据 库 中 计算 机 系 CS 学 生 的 学 号 、 姓 名 及 年 龄 。 


SELECT Sno,Sname,Age 
FROM S 
WHERE SD='CS'; 


注意 ， 为 了 便于 理解 查询 语句 的 结构 ， 通 常 在 写 SQL 语句 时 要 将 保留 字 (如 FROM 或 
WHERE) 作为 每 一 行 的 开头 。 但 是 ， 如 果 一 个 查询 或 子 查询 非常 得， 可 以 直接 将 它们 写 在 一 
行 上 ， 这 种 风格 使 得 查询 语句 很 紧凑 ， 也 具有 很 好 的 可 读 性 。 如 上 例 也 可 写成 如 下 形式 : 


SELECT Sno,Sname,Age FROM S WHERE SD='CS'; 


【 例 9.15】 若 当 前 年 份 为 2017， 查 询 学 生 的 出 生年 份 。 
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SELECT Sno,2017-Age FROM  S: 
3. 连接 查询 


若 查询 涉及 两 个 以 上 的 表 ， 则 称 为 连接 查询 。 
【 例 9.16】 检索 选修 了 课程 号 “C17” 的 学 生 的 学 号 和 姓名 , 可 用 连接 查询 和 谍 套 查询 实现 ， 
方法 如 下 : 
SELECT Sno, Sname 
FROM S,SC 
WHERE S.Sno=SC. Sno AND SC.Cno= C1' 


【 例 9.17】 检索 选修 了 课程 名 “MS” 的 学 生 的 学 号 和 姓名 ， 可 用 连接 查询 和 翌 套 查询 实 
现 ， 方法 如 下 : 
SELECT Sno,Sname 
FROM SS,SC,C 
WHERE S.Sno=SC. Sno AND SC.Cno=C.Cno ANDC.Cname=MS' 
【 例 9.18】 检索 至 少 选 修了 课程 号 “C1” 和 “C3” 的 学 生 的 学 号 ， 实 现 方法 如 下 : 


SELECT Sno 
FROM SCSCX, SCSCY 
WHERE SCX. Sno=SCY. Sno AND SCX.Cno='C!1' AND SCY.Cno=' C3' 


4. 子 查 询 与 聚集 函数 
1) 子 查 询 
子 查 询 也 称 嵌 套 查 询 。 嵌 套 查询 是 指 一 个 SELECTFROM-WHERE 查询 块 可 以 嵌入 另 一 个 


查询 块 之 中 。 在 SQL 中 允许 多 重典 套 。 
【 例 9.19】 例 9.17 可 以 采用 嵌 套 查询 来 实现 。 


SELECT Sno，Sname 


FROM S 
WHERE SnoIN(SELECT Sno 
FROM SC 
WHERE CnoJIN (SELECT Cno 


FROMC 
WHERE Cname= MS')) 
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2) 聚集 函数 
聚集 函数 是 以 一 个 值 的 集合 为 输入 , 返回 单个 值 的 函数 .SQL 提供 了 5 个 预定 义 聚集 函数 : 
平均 值 AVG、 最 小 值 MIN、 最 大 值 MAX、 求 和 SUM 以 及 计数 COUNT， 如 表 9-4 所 示 。 


表 9-4 聚集 函数 的 功能 
功 能 
统计 元 组 个 数 
统计 一 列 中 值 的 个 数 
计算 一 列 〈 该 列 应 为 数值 型 ) 中 值 的 总 和 
计算 一 列 《〈 该 列 应 为 数值 型 ) 值 的 平均 值 
求 一 列 值 的 最 大 值 
求 一 列 值 的 最 小 值 


聚集 函数 名 
COUNT(UDISTINCTIALL]9) 
COUNT(DISTINCTIALL]< 列 名 >) 
SUM([DISTINCTIALL]< 列 名 >) 
AVG([DISTINCTIALL]< 列 名 >) 
MAX([DISTINCTIALL]< 列 名 >) 
MIN([DISTINCTIALL]< 列 名 >) 


使 用 ANY 和 ALL 谓词 必须 同时 使 用 比较 运算 符 ,其 含义 及 等 价 的 转换 关系 如 表 9-5 所 示 。 
用 聚集 函数 实现 子 查询 通常 比 直接 用 ALL 或 ANY 查询 效率 要 高 。 


表 9-5 ANY、ALL 谓词 的 含义 及 等 价 的 转换 关系 


谓 词 语 义 等 价 转 换 关 系 
>ANY 大 于 子 查 询 结 果 中 的 某 个 值 >MIN 
>ALL 大 于 子 查 询 结 果 中 的 所 有 值 >MAX 
<ANY 小 于 子 查询 结果 中 的 某 个 值 <MAX 
<ALL 小 于 子 查 询 结 果 中 的 所 有 值 <MIN 
>=ANY 大 于 等 于 子 查询 结果 中 的 某 个 值 >=MIN 
>=ALL 大 于 等 于 子 查 询 结 果 中 的 所 有 值 >=MAX 
<=ANY 小 于 等 于 子 查询 结果 中 的 某 个 值 <=MAX 
<=ALL 小 于 等 于 子 查询 结果 中 的 所 有 值 <=MIN 
<>ANY 不 等 于 子 查询 结果 中 的 某 个 值 — 
<>ALL 不 等 于 子 查询 结果 中 的 任何 一 个 值 NOTIN 
=ANY 等 于 子 查询 结果 中 的 某 个 值 IN 
=ALL 等 于 子 查询 结果 中 的 所 有 值 — 


【 例 9.20】 查询 课程 Cl 的 最 高 分 和 最 低 分 以 及 高 低 分 之 间 的 差距 。 


SELECT MAX(G),MIN(G),MAX(G)-MIN(G) 
FROM Se 
WHERE Cno='C1' 
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【 例 9.21】 查询 其 他 系 比 计算 机 系 CS 所 有 学 生年 龄 都 要 小 的 学 生 的 姓名 及 年 龄 。 
方法 1: (用 ALL 谓词 ) 


SELECT Sname,Age 


FROM S 
WHERE Age<ALL (SELECT Age 
FROM S 
WHERE SD='CS') 
AND SD<>'CS' 


方法 2: (用 MIN 聚集 函数 ) 从 等 价 的 转换 关系 表 9-5 中 可 见 ，<ALL 可 用 <MIN 代 换 。 


SELECT Sname, Age 


FROM S 
WHERE Age< (SELECT MIN (Age) 
FROMS 
WHERE SD='Cs' ) 
AND SD<>'CS' 


说 明 : 方法 2 实际 上 是 找 出 计算 机 系 年 龄 最 小 的 学 生 的 年 龄 ， 只 要 其 他 系 的 学 生年 龄 比 这 
个 年 龄 小 ， 那 么 就 应 在 结果 集中 。 

【 例 9.22】 查询 其 他 系 比 计算 机 系 某 一 学 生年 龄 小 的 学 生 的 姓名 及 年 龄 。 

方法 1: (用 ANY 谓词) 


SELECT Sname,Age 


FROM S 
WHERE Age<ANY (SELECT Age 
FROMS 
WHERE SD='CS) 
AND SD<>'CS' 


方法 2:〈 用 MAX 聚集 函数 ) 从 等 价 的 转换 关系 表 9-5 中 可 以 看 到 ,<ANY 可 用 <MAX 代 换 。 


SELECT Sname.Age 
FROM S 
WHERE Age< (SELECT MAX (Age) 
FROM S 
WHERE SD='CS' ) 
AND SD<>'CS' 
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说 明 : 方法 2 实际 上 是 找 出 计算 机 系 年 龄 最 大 的 学 生 的 年 龄 ， 只 要 其 他 系 的 学 生年 龄 比 这 
个 年 龄 大 ， 那 么 就 应 在 结果 集中 。 


S， 分 组 查询 


1) GROUP BY 子 句 

在 WHERE 子 句 后 面 加 上 GROUP BY 子 句 可 以 对 元 组 进行 分 组 , 保留 字 GROUP BY 后 面 
跟着 一 个 分 组 属性 列表 。 最 简单 的 情况 是 FROM 子 句 后 面具 有 一 个 关系 , 根据 分 组 属性 对 它 的 
元 组 进行 分 组 。SELECT 子 句 中 使 用 的 聚集 操作 符 仅 用 在 每 个 分 组 上 。 

【 例 9.23】 学 生 数 据 库 中 的 SC 关系 ， 查 询 每 个 学 生 的 平均 成 绩 。 

SELECT Sno,AVG(Grade) 


FROM SC 
GROUP BY Sno 


该 语句 是 将 SC 关系 的 元 组 重新 组 织 并 进行 分 组 , 使 得 不 同学 号 的 元 组 分 别 被 组 织 在 一 起 ， 
求 出 各 个 学 生 的 平均 值 并 输出 。 

2) HAVING 子 句 

假如 元 组 在 分 组 前 按照 某 种 方式 加 上 限制 ， 使 得 不 需要 的 分 组 为 室 ， 在 GROUP BY 子 句 
后 面 跟 一 个 HAVING 子 句 即 可 。 

注意 : 当 元 组 含有 空 值 时 ， 应 该 记 住 以 下 两 点 。 

(1) 空 值 在 任何 聚集 操作 中 被 忽视 。 它 对 求 和 、 求 平均 值 和 计数 都 没有 影响 。 它 也 不 能 是 
某 列 的 最 大 值 或 最 小 值 。 例 如 ，COUNT(*) 是 某 个 关系 中 所 有 元 组 数目 之 和 ， 但 COUNT(A) 却 
是 A 属性 非 空 的 元 组 个 数 之 和 。 

(2) NULL 值 又 可 以 在 分 组 属性 中 看 作 是 一 个 一 般 的 值 。 例 如 ， 在 SELECT A, AVG(B) 
FORMR 中 ， 当 A 的 属性 值 为 空 时 ， 就 会 统计 A=NULL 的 所 有 元 组 中 B 的 均值 。 

【 例 9.24】 供应 商 数据 库 中 的 S、P、J SPJ 关系 ， 查 询 某 工程 至 少 用 了 三 家 供应 商 ( 包 
含 三 家 ) 供应 的 零件 的 平均 数量 ， 并 按 工 程 号 的 降序 排列 。 


SELECT Jno, AVG(Qty) 
FROM SPJ 
GROUP BY Jno 
HAVING COUNT(DISTINCT(Sno))> 2 
ORDER BY Jno DESC: 
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根据 题 意 “ 某 工程 至 少 用 了 三 家 供应 商 〈 包 含 三 家 ) 供应 的 零件 ” 应 该 按照 工程 号 分 组 ， 
而 且 应 该 加 上 条 件 一 一 供应 商 的 数目 。 但 是 需要 注意 的 是 ， 一 个 工程 项 目 可 能 用 了 同一 个 供应 
商 的 多 种 零件 ， 因 此 ， 在 统计 供应 商 数 的 时 候 需 要 加 上 DISTINCT， 以 避免 重复 统计 导致 错误 
的 结果 。 例 如 ， 按 工程 号 Jo=Jl1' 分 组 ， 其 结果 如 表 9-6 所 示 。 如 果 不 加 DISTINCT， 统 计 的 结 
果 数 为 7; 而 加 了 DISTINCT， 统 计 的 结果 数 为 5。 


表 9-6 按 工程 号 Jno='J1' 分 组 


Sno Qty 
sl 200 
S2 300 
S2 200 
S2 
6. 更 名 运算 


SQL 提供 了 可 为 关系 和 属性 重新 命名 的 机 制 ， 这 是 通过 使 用 具有 如 下 形式 的 AS 子 句 来 实 
现 的 : 


Old-name AS new-name 


AS 子 句 既 可 出 现在 SELECT 子 句 ， 也 可 出 现在 FROM 子 句 中 。 
【 例 9.25】 查询 计算 机 系 学 生 的 Sname 和 Age, 但 Sname 用 “姓名 ”表示 ，Age 用 “年 龄 ” 
表示 。 其 语句 如 下 : 


SELECT Sname AS 姓名 ,Age AS 年 龄 
FROM S 
WHERE Age< (SELECT MAX (Age) 
FROM S 
WHERE SD='CS') 
AND SD<>CS' 


SQL 中 的 元 组 变量 必须 和 特定 的 关系 相 联系 。 元 组 变量 是 通过 在 FROM 子 句 中 使 用 AS 
子 句 来 定义 的 。 


【 例 9.26】 查询 计算 机 系 选修 了 C1 课程 的 学 生 的 姓名 Sname 和 成 绩 Grade。 其 语句 如 下 : 


SELECT Sname,Grade 
FROM Students AS xscASY 
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WHERE x.sno=y.sno AND y.cno='C1'; 
元 组 变量 在 比较 同一 关系 的 两 个 元 组 时 非常 有 用 。 
7. 字符 串 操作 


对 于 字符 串 进行 的 最 常用 的 操作 是 使 用 操作 符 LIKE 的 模式 匹配 。 使 用 两 个 特殊 的 字符 来 
描述 模式 :“%” 匹 配 任意 字符 串 ;“_” 匹 配 任意 一 个 字符 。 模 式 是 大 小 写 敏感 的 。 例 如 : 

Marry% 匹 配 任何 以 Marry 开头 的 字符 串 ;%idge% 匹 配 任何 包含 idge 的 字符 串 ， 例 如 
Marryidge、Rock Ridge、Mianus Bridge 和 Ridgeway。 

“_” 匹 配 只 含 两 个 字符 的 字符 串 ;“_%” 匹 配 至 少 包 含 两 个 字符 的 字符 串 。 

【 例 9.27】 学 生 关 系 模式 为 (Sno,Sname,Sex,SD,Age,Add)， 其 中 ，Sno 为 学 号 ，Sname 为 
姓名 ，Sex 为 性 别 ，SD 为 所 在 系 ，Age 为 年 龄 ，Add 为 家 庭 住 址 。 请 查询 : 

(1) 家 庭 住 址 包含 “科技 路 ”的 学 生 的 姓名 。 

(2) 名 字 为 “ 晓 军 ” 的 学 生 的 姓名 、 年 龄 和 所 在 系 。 

解 : (1) 查询 家 庭 住址 包含 “科技 路 ”的 学 生 的 姓名 的 SQL 语句 如 下 : 

SELECT Sname 


FROM S 
WHERE AddLIKE '"% 科 技 路 %' 


(2) 查询 名 字 为 “ 晓 军 ” 的 学 生 的 姓名 、 年 龄 和 所 在 系 的 SQL 语句 如 下 : 
SELECT Sname,Age,SD 
FROM S 
WHERE Sname LIKE ' 晓 军 ' 
为 了 使 模式 中 包含 特殊 模式 字符 〈 即 % 和 _)， 在 SQL 中 允许 使 用 ESCAPE 关键 词 来 定义 
在 LIKE 比较 中 使 用 ESCAPE 关键 词 来 定义 转 义 符 ， 例 如 使 用 反 斜 枉 “\” 作 为 转 义 符 。 
LIKE 'ab\%cd%'ESCAPE ww， 匹配 所 有 以 ab%ed 开头 的 字符 串 。 
LIKE 'ab\cd%w'ESCAPE \， 匹 配 所 有 以 ab\cd 开头 的 字符 串 。 
8. 视图 的 查询 
【 例 9.28】 建立 “计算 机 系 ”(CS 表示 计算 机 系 ) 学 生 的 视图 ， 并 要 求 进行 修改 、 插 入 操 
作 时 保证 该 视图 只 有 计算 机 系 的 学 生 。 


CREAIE VIEW CS-STUDENT 
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AS SELECT Sno,Sname,Sage,Sex 
FROM Student 

WHERE SD='CS' 

WITH CHECK OPTION:; 


此 时 查询 计算 机 系 年 龄 小 于 20 岁 的 学 生 的 学 号 及 年 龄 的 SQL 语句 如 下 : 

SELECT Sno,Age FORM CS-STUDENT WHERE SD='CS' AND Age<20: 

系统 执行 该 语句 时 ， 通 常 先 将 其 转换 成 等 价 的 对 基本 表 的 查询 ， 然 后 执行 查询 语句 。 即 当 
查询 视图 表 时 ， 系 统 先 从 数据 字典 中 取出 该 视图 的 定义 ， 然 后 将 定义 中 的 查询 语句 和 对 该 视图 
的 查询 语句 结合 起 来 ， 形 成 一 个 修正 的 查询 语句 。 对 上 例 修正 之 后 的 查询 语句 为 : 


SELECT Sno,Age FORM Student WHERE SD='CS' AND Age<20: 
9.4.5 ”SQL 数据 更 新 
1. 插入 


如 果 要 在 关系 数据 库 中 插入 数据 ， 可 以 指定 被 插入 的 元 组 ， 或 者 用 查询 语句 选 出 一 批 待 插 
入 的 元 组 。 插 入 语句 的 基本 格式 如 下 : 
INSERT INTO 基本 表 名 (字段 名 [, 字 段 名 ]…) 
VALUES( 常 量 [, 常 量 ]…); 查询 语句 
INSERT INTO 基本 表 名 (列表 名 ) 
SELECT 查询 语句 


【 例 9.29】 将 学 号 为 3002、 课 程 号 为 C4、 成 绩 为 98 的 元 组 插入 SC 关系 中 。 其 语句 如 下 : 
INSERT INTO SC 

VALUES('3002', 'C4',98) 
【 例 9.30】 创建 了 一 个 新 的 视图 v_employees， 该 视图 基于 表 employees 创建 。 


CREAIE VIEW v_employees(number, name, age, sex, salary) 
AS 
SELECT number, name, age, sex, salary 
FROM employees 
WHERE name=' 张 三 ' 


通过 执行 以 下 语句 使 用 v_employees 视图 向 表 employees 中 添加 一 条 新 的 数据 记录 。 


INSERT INTO v_ employees 
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VALUES(001, 李 力 ,22,m',2000) 
2. 删除 


DELETE FROM 基本 表 名 
[WHERE 条 件 表达 式 ] 


【 例 9.31】 删除 表 employees 中 姓名 为 张 然 的 记录 。 


DELETE FROM employees 
WHERE name=' 张 然 


3. 修改 

UPDATE 基本 表 名 

SET 列 名 = 值 表达 式 (, 列 名 = 值 表 达 式 …) 
[WHERE 条 件 表达 式 ] 

【 例 9.32】 将 教师 的 工资 增加 5%。 


UPDATE teachers 
SET Salary = Salary*1.05 


【 例 9.33】 将 教师 的 工资 少 于 1000 的 增加 5% 工资 。 


UPDATE teachers 
SET Salary = Salary*1.05 
WHERE Salary < 1000 


使 用 视图 可 以 更 新 数据 记录 ， 但 应 该 注意 的 是 ， 更 新 的 只 是 数据 库 中 的 基 表 。 
【 例 9.34】 创建 一 个 基于 表 employees 的 视图 v_employees， 然 后 通过 该 视图 修改 表 
employees 中 的 记录 。 其 语句 如 下 : 


CREAIE VIEW vemployees 
AS 
SELECT * FROM employees 
UPDAIE Vv_employees 
SET name= 张 然 
WHERE name=' 张 三 ' 


9.4.6 ”SQL 访问 控制 
数据 控制 控制 的 是 用 户 对 数据 的 存储 权力 ， 是 由 DBA 决定 的 。 但 是 ， 某 个 用 户 对 某 类 数 
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据 具 有 何 种 权利 ， 是 个 政策 问题 而 不 是 技术 问题 。DBMS 的 功能 就 是 保证 这 些 决定 的 执行 。 因 
此 ，DBMS 数据 控制 应 具有 以 下 功能 。 

(1) 通过 GRANT 和 REVOKE 将 授权 通知 系统 ， 并 存 入 数据 字典 。 

(2) 当 用 户 提出 请 求 时 ， 根 据 授权 情况 检查 是 否 执 行 操作 请 求 。 

SQL 标准 包括 DELETE、INSERT、SELECT 和 UPDATE 权限 。 SELECT 权限 对 应 于 READ 
权限 ，SQL 还 包括 了 REFERENCES 权限 ， 用 来 限制 用 户 在 创建 关系 时 定义 外 码 的 能 力 。 

1. 授权 的 语句 格式 


GRANT < 权限 >[,< 权 限 >]…[ON< 对 象 类 型 >< 对 象 名 >]TO < 用 户 >[L< 用 户 >]… 
[WITH GRANT OPTION]; 


注意 : 不 同类 型 的 操作 对 象 有 不 同 的 操作 权限 ， 常 见 的 操作 权限 如 表 9-7 所 示 。 
表 9-7 常见 的 操作 权限 


对 象 操作 权限 

| SELECT、INSERT、UPDATE、DELETE、 
ALL PRIVILEGES 〈4 种 权限 的 总 和 ) 

视 交 SELECT、INSERT、UPDAITE、DELETE、 
ALLPRIVILEGES (4 种 权限 的 总 和 ) 


re SELECT、INSERT、UPDATE、DELETE、ALTER、INDEX 
ALL PRIVILEGES (6 种 权限 的 总 和 ) 
数据 库 CREATETAB 建立 表 的 权限 ， 可 由 DBA 授予 普通 用 户 
说 明 如 下 。 
。 PUBLIC: 接受 权限 的 用 户 可 以 是 单个 或 多 个 具体 的 用 户 , PUBLIC 参数 可 将 权限 赋 给 
全 体 用 户 。 
。 WITH GRANT OPTION: 若 指定 了 此 子 句 ， 那 么 获得 了 权限 的 用 户 还 可 以 将 权限 赋 给 
其 他 用 户 。 


【 例 9.3S】 如 果 用 户 要 求 给 数据 库 SPJ 中 的 供应 商 S、 零 件 P、 项 目 了 表 赋 予 各 种 权限 。 
(1) 将 对 供应 商 S、 零 件 P、 项 目 J 的 所 有 操作 权限 赋 给 用 户 Userl 及 User2， 其 授权 语句 
如 下 : 


GRANTALL PRIVILEGES ON TABLE S.PJ TO Userl, User2; 


(2) 将 对 供应 商 S 的 插入 权限 赋 给 用 户 User1， 并 允许 将 此 权限 赋 给 其 他 用 户 ， 其 授权 语 
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句 如 下 : 
GRANT INSERT ON TABLE STO Userl WITH GRANT OPTION:; 
(3) DBA 把 数据 库 SPJ 中 建立 表 的 权限 赋 给 用 户 Userl1， 其 授权 语句 如 下 : 
GRANT CREATETAB ON DATABASE SPJTO Userl:; 
2. 收回 权限 语句 格式 


REVOKE < 权限 >[,< 权 限 >]…[ON< 对 象 类 型 >< 对 象 名 >] 
FROM < 用 户 >[,< 用 户 >]…; 


【 例 9.36】 要 求 回收 用 户 对 数据 库 SPJ 中 供应 商 S、 零 件 P、 项 目 了 表 的 操作 权限 。 
(1) 将 用 户 Userl 及 User2 对 供应 商 S、 零 件 P、 项 目 J 的 所 有 操作 权限 收回 。 


REVOKE ALL PRIVILEGES ON TABLE S,PJ FROM Userl, User2; 

(2) 将 所 有 用 户 对 供应 商 $ 的 所 有 查询 权限 收回 。 

REVOKE SELECT ON TABLE SFROM PUBLIC; 

(3) 将 Userl 用 户 对 供应 商 S 的 供应 商 编号 Sno 的 修改 权限 收回 。 

REVOKE UPDATE(Sno) ON TABLE S FROM Userl; 
9.4.7 ”嵌入 式 SQL 

SQL 提供 了 将 SQL 语句 嵌入 到 某 种 高 级 语言 中 的 使 用 方式 ， 通 常 采 用 预 编译 的 方法 识别 
霸 入 到 高 级 语言 中 的 SQL 语句 。 该 方法 的 关键 问题 是 必须 区 分 主语 言 中 嵌入 的 SQL 语句 ， 以 
及 主语 言 和 SQL 间 的 通信 问题 。 为 了 区 分 主语 言 与 SQL 语言 ， 需 要 在 所 有 的 SQL 语句 前 加 前 
级 EXEC SQL， 而 SQL 的 结束 标志 随 主 语言 的 不 同 而 不 同 。 

例如 ，PL/I 和 C 语言 的 引用 格式 为 : 


EXEC SQL <SQL 语句 >; 


又 如 ，COBOL 语言 的 引用 格式 为 : 

EXEC SQL <SQL 语句 > END-EXEC 

嵌入 式 SQL 与 主语 言 之 间 的 通信 通常 有 以 下 3 种 方式 。 

(1) SQL 通信 区 (SQL Communication Area，SQLCA) 向 主语 言传 递 SQL 语句 执行 的 状 
态 信 息 ， 使 主语 言 能 够 根据 此 信息 控制 程序 流程 。 
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(2) 主 变量 也 称 共享 变量 。 主 语言 向 SQL 语句 提供 参数 主要 通过 主 变量 ， 主 变量 由 主语 
言 的 程序 定义 ， 并 用 SQL 的 DECLARE 语句 说 明 。 在 引用 时 ， 为 了 与 SQL 属性 名 相 区 别 ， 需 
要 在 主 变量 前 加 “:”。 

【 例 9.37】 根据 共享 变量 givensno 的 值 , 查询 学 生 关系 students 中 学 生 的 姓名 、 年 龄 和 性 别 。 


EXEC SQL SELECT sname,age,sex 
INTO :Msname,:Mage,:Msex 
FROM students 
WHERE sno=:givensno; 


(3) 游标 SQL 语言 是 面向 集合 的 ， 一 条 SQL 语句 可 产生 或 处 理 多 条 记录 ， 而 主语 言 是 面 
向 记录 的 ， 一 组 主 变量 一 次 只 能 放 一 条 记录 。 所 以 ， 引 入 游标 ， 通 过 移动 游标 指针 来 决定 获取 
哪 一 条 记录 。 


9.5 ”关系 数据 库 的 规范 化 


在 关系 模型 中 ， 一 个 数据 库 模式 是 关系 模式 的 集合 。 关 系数 据 理论 是 指导 数据 库 设计 的 基 
础 ， 关 系数 据 库 设 计 是 数据 库 语 义学 的 问题 。 通 常 ， 要 保证 构造 的 关系 既 能 准确 地 反映 现实 世 
界 ， 又 有 利于 应 用 和 具体 的 操作 。 关 系数 据 库 设计 理论 的 核心 是 数据 间 的 函数 依赖 ， 衡 量 的 标 
准 是 关系 规范 化 的 程度 及 分 解 的 无 损 连 接 和 保持 函数 依赖 性 。 关 系数 据 库 设 计 的 目标 是 生成 一 
组 合适 的 、 性 能 良好 的 关系 模式 ， 以 减少 系统 中 信息 存储 的 元 余 度 ， 并 可 方便 地 获取 信息 。 


9.5.1 函数 依赖 


数据 依赖 是 通过 一 个 关系 中 属性 间 值 的 相等 与 否 体现 出 来 的 数据 间 的 相互 关系 ,是 现实 世 
界 属 性 间 联 系 和 约束 的 抽象 ， 是 数据 内 在 的 性 质 ， 是 语义 的 体现 。 函 数 依赖 则 是 一 种 最 重要 、 
最 基本 的 数据 依赖 。 

(1) 函数 依赖 。 设 RC) 是 属性 集 UU 上 的 关系 模式 ， XX、 了 是 U 的 子 集 。 若 对 RD 的 任何 
一 个 可 能 的 关系 x, r 中 不 可 能 存在 两 个 元 组 在 天上 的 属性 值 相等 , 而 在 Y 上 的 属性 值 不 等 ， 则 
称 民 函数 决定 了 或 了 函数 依赖 于 总 记 作 碟 > 了 

(2) 非 平 凡 的 函数 依赖 。 如 果 五 >Y,， 但 琢 系 则 称 蕊 * 了 是 非 平凡 的 函数 依赖 。 一 般 情 况 
下 ， 总 是 讨论 非 平凡 的 函数 依赖 。 

(3) 平凡 的 函数 依赖 。 如 果 耻 >Y,， 但 孔 马 则 称 卫 > 了 是 平凡 的 函数 依赖 。 

(4) 完全 函数 依赖 。 在 R( 思 中， 如 果 下 > 了 Y， 并 且 对 于 陈 的 任何 一 个 真子 集 X' 都 有 XX' 不 
能 决定 了 则 称 了 对 了 完全 函数 依赖 ， 记 作 子 一 二 >Y。 
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例如 , 给 定 一 个 学 生 选 课 关 系 SC(Sno, Cno,G), 可 以 得 到 F={(Sno, Cno) 一 G }, 对 (Sno.Cno) 
中 的 任何 一 个 真子 集 Sno 或 Cno 都 不 能 决定 G， 所 以 ，G 完全 依赖 于 Sno、Cno。 

(5) 部 分 函数 依赖 。 如 果 对 > 了 了， 但 了 不 完全 函数 依赖 于 革 ， 则 称 了 对 于 部 分 函数 依赖 ， 
记 作 碟 一 2 > 了 。 部 分 函数 依赖 也 称 为 局 部 函数 依赖 。 

(6) 传递 依赖 。 在 R(ULA) 中 ， 如 果 下 > 了 ，Y¥X，Y->Z， 则 称 Z 对 下 传递 依赖 。 

(7) 码 。 设 天 为 RD 中 属性 的 组 合 , 车 KU， 且 对 于 天 的 任何 一 个 真子 集 K' 都 及 ' 不 

决定 U， 则 天 为 R 的 候选 码 。 若 有 多 个 候选 码 ， 则 选 一 个 作为 主 码 。 候 选 码 通常 也 称 为 候选 

关键 字 。 

(8) 主 属性 和 非 主 属性 。 包含 在 任何 一 个 候选 码 中 的 属性 称 为 主 属性 , 否则 称 为 非 主 属性 。 

(9) 外 码 。 若 RC 中 的 属性 或 属性 组 于 非 R 的 码 , 但 外 是 另 一 个 关系 的 码 , 则 称 下 为 外 码 。 

(10) 函数 依赖 的 公理 系统 (Armstrong 公理 系统 )。 设 关系 模式 R(U,F),， 其 中 U 为 属性 集 ， 
FF 是 U 上 的 一 组 函数 依赖 ， 那 么 有 以 下 推理 规则 。 

。 Al 自 反 律 : 阁 YCXCUV， 则 耻 3 了 为 所 丝 涵 。 

。 A2 增 广 律 : 若 素 * 了 为 下 所 蕴涵 ， 且 ZU， 则 三 一 到 为 下 所 蕴涵 。 

。 ”A3 传递 律 : 若 瑟 7 一 >*Z 为 下 所 蕴涵 ， 则 瑟 >Z 为 下 所 蕴涵 。 

根据 上 述 3 条 推理 规则 又 可 推出 下 述 3 条 推理 规则 。 

。 合并 规则 : 车 X37， 33Z， 则 五 > 开 为 下 所 蕴涵 。 

。 伪 传 递 率 ， 若 诺 37，WY-Z， 则 XWV2 为 下 所 草 涵 。 

。 分 解 规则 若 了 > 了 ，ZcCY， 则 X32 为 玉 所 蕴涵 。 


9.5.2 规范 化 


关系 数据 库 设 计 的 方法 之 一 就 是 设计 满足 适当 范式 的 模式 , 通常 可 以 通过 判断 分 解 后 的 模 
式 达到 几 范 式 来 评价 模式 规范 化 的 程度 。 范 式 有 INF、2NF、3NF、BCNF、4NF 和 SNF， 其 中 
1NF 的 级 别 最 低 。 这 几 种 范式 之 间 ，5NFC4NFCBCNFC3NFC2NFCINE 成 立 。 通 过 分 解 ， 可 
以 将 一 个 低 一 级 范式 的 关系 模式 转换 成 若干 个 高 一 级 范式 的 关系 模式 ， 这 个 过 程 称 为 规范 化 。 
下 面 给 出 INF、2NF 和 3NF 的 定义 。 


1. 1NF (第 一 范式 ) 


定义 : 若 关 系 模式 R 的 每 一 个 分 量 是 不 可 再 分 的 数据 项 ， 则 关系 模式 R 属于 第 一 范式 。 
例如 ， 供 应 者 和 它 所 提供 的 零件 信息 ， 关 系 模式 FIRST 和 函数 依赖 集 五 如 下 : 


FIRST(Sno,Sname,.Status,City,Pno,Qty) 
F={ Sno 一 Sname,Sno 一 Status,Status 一 City,(Sno.Pno) 一 Qty} 
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若 具体 的 关系 如 表 9-8 所 示 。 从 表 9-8 可 以 看 出 ， 每 一 个 分 量 都 是 不 可 再 分 的 数据 项 ， 所 


以 是 INF 的 。 但 是 ，1NF 存在 以 下 4 个 问题 。 
表 9-8 FIRST 

Sno Sname Pno Qty 
S1 精 益 Pl 200 
S1 精 益 P2 300 
Sl 精 益 Pp3 480 
S2 盛 锡 P2 168 
S2 盛 锡 P3 500 
S3 东方 红 Pl 300 
S3 东方 红 P2 280 
S4 泰 达 P2 460 

(1) 宛 余 度 大 。 例 如 ， 每 个 供应 者 的 Sno、Sname、Status、City 要 与 其 供应 的 零件 的 种 类 


- 样 多 。 

(2) 引起 修改 操作 的 不 一 致 性 。 例 如， 供应 者 S1 从 “天 津 ” 搬 到 “上 海 ”， 若 稍 不 注意 ， 
就 会 使 一 些 数据 被 修改 ， 另 一 些 数据 没有 被 修改 ， 导 致 数据 修改 的 不 一 致 性 。 

(3) 插入 异常 。 关 系 模式 FRIST 的 主 码 为 Sno、Pno， 按 照 关 系 模式 实体 完整 性 规定 ， 主 
人 码 不 能 取 空 值 或 部 分 取 空 值 。 这 样 ， 当 某 个 供应 者 的 某 些 信息 未 提供 时 (如 Pno)， 则 不 能 进行 
插入 操作 ， 这 就 是 所 谓 的 插入 异常 。 

(4) 删除 异常 。 若 供应 商 S4 的 P2 零件 销售 完了 ， 并 且 以 后 不 再 销售 P2 零件 ， 那 么 应 删 
除 该 元 组 。 这 样 ， 在 基本 关系 FIRST 找 不 到 S4， 而 S4 又 是 客观 存在 的 。 

正 因为 上 述 4 个 原因 ， 所 以 要 对 模式 进行 分 解 ， 并 引入 了 2NF。 


2. 2NF (第 二 范式 ) 


定义 : 若 关系 模式 ReE1NF， 且 每 一 个 非 主 属性 完全 依赖 于 码 ， 则 关系 模式 RE2NF。 

换 句 话说 ， 当 1NF 消除 了 非 主 属性 对 码 的 部 分 函数 依赖 ， 则 称 为 2NF。 

例如 ，FIRST 关系 中 的 码 是 Sno、Pno， 而 Sno 一 Status， 因 此 非 主 属性 Status 部 分 函数 依 
赖 于 码 ， 故 非 2NF 的 。 

若 此 时 将 FIRST 关系 分 解 为 FIRST1 (Sno，Sname，Status，City) 和 FIRST2 (Sno，Pno， 
Qty)。 其 中 ，FIRST1E2NF，FIRST2E2NF。 因 为 分 解 后 的 关系 模式 FIRSTI1 的 码 为 Sno， 非 
主 属性 Sname、Status、City 完全 依赖 于 码 Sno， 所 以 属于 2NF; 关系 模式 FIRST2 的 码 为 Sno、 
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Pno， 非 主 属性 Qty 完全 依赖 于 码 ， 所 以 也 属于 2NF。 
3. 3NF (第 三 范式 ) 


定义 : 若 关系 模式 R(U,F) 中 若 不 存在 这 样 的 码 防 ， 属 性 组 了 及 非 主 属性 Z(Z¢ 了 使 得 
了 >Y(Y 太 了 车 )，7- 2 成立， 则 关系 模式 RE3NF。 

即 当 2NF 消除 了 非 主 属性 对 码 的 传递 函数 依赖 ， 则 称 为 3NF。 

例如 ，FIRST1¢3NF， 因 为 在 分 解 后 的 关系 模式 FIRST1 中 有 Sno 一 Status，Status 一 City， 
存在 着 非 主 属性 City 传递 依赖 于 码 Sno。 若 此 时 将 FIRSTI1 继续 分 解 为 : 

FIRST11 (Sno, Sname, Status) E3NF 

FIRST12 (Status, City) E3NF 


通过 上 述 分 解 ,数据 库 模式 FIRST 转换 为 FIRSTI11(Sno,Sname,Status)、FIRST12(Status,City) 
和 FIRST2(Sno,Pno,Qty)3 个 子 模式 。 由 于 这 3 个 子 模式 都 达到 了 3NF， 因 此 称 分 解 后 的 数据 库 
模式 达到 了 3NF。 

可 以 证 明 , 3NF 的 模式 必 是 2NF 的 模式 。 产生 元 余 和 异常 的 两 个 重要 原因 是 部 分 依赖 和 传 
递 依赖 。 因为 3NF 模式 中 不 存在 非 主 属性 对 码 的 部 分 函数 依赖 和 传递 函数 依赖 , 所 以 具有 较 好 
的 性 能 。 对 于 非 3NF 的 INF、2NF， 其 性 能 弱 ， 一 般 不 宜 作 为 数据 库 模式 ， 通 常 要 将 它们 变换 
成 为 3NF 或 更 高 级 别 的 范式 ， 这 个 变换 过 程 称 为 “关系 模式 的 规范 化 处 理 ”。 


9.5.3 模式 分 解 及 分 解 应 具有 的 特性 
1. 分 解 


定义 : 关系 模式 R(U, 也 的 一 个 分 解 是 指 p={Ri (Ui, 让), Rs (Uz, 五 )…, Ra (Us 卫 ,)}， 其 中 ， 
U= U U; ,并 且 没 有 Uic U1<i,jsn;Fi 是 在 Ui 上 的 投影 , FX 了 |X oY 了 EF 人 XYC Ui}。 


i=1 

对 一 个 给 定 的 模式 进行 分 解 ， 使 得 分 解 后 的 模式 是 否 与 原来 的 模式 等 价 有 3 种 情况 。 
(1) 分 解 具有 无 损 连 接 性 。 

(2) 分 解 要 保持 函数 依赖 。 

(3) 分 解 既 要 无 损 连 接 性 ， 又 要 保持 函数 依赖 。 


2. 无 损 连接 


定义 :p={Ri (五 ). Re (2, 五), …, RE (Ui DD)} 是 关系 模式 R(U, 也 的 一 个 分 解 , 若 对 R(U, 


于 512 二 。 软件 设计 i 教程 (第 5 版 ) 


也 的 任何 一 个 关系 + 均 有 :=m (成 立 ， 则 分 解 p 具有 无 损 连 接 性 (简称 无 损 分 解 )， 其 中 ， 
k 
Mm,(r)=P<A ng (7) 
i=1 
定理 : 关系 模式 R(U, 刀 的 一 个 分 解 p={ Ri (Ui, A), R, (U, 万 )} 具 有 无 损 连 接 的 充分 必要 的 
条 件 是 NN 一-UEF' 或 UN 如 >UyU1EF* ,证明 上 略 。 


3. 保持 函数 依赖 


定义 : 设 关系 模式 R (Uf) 的 一 个 分 解 p ={Ri (CFRP 下),，…, Re (Ui FD}， 如 果 
大 
玉 =(Ura(CF)) ， 则 称 分 解 p 保持 函数 依赖 。 
i=1 


9.6 ”数据 库 的 控制 功能 


9.6.1 事务 管理 


事务 是 一 个 操作 序列 ， 这 些 操 作 “ 要 么 都 做 ， 要 么 都 不 做 ” 是 数据 库 环 境 中 不 可 分 割 的 
逻辑 工作 单位 。 事务 和 程序 是 两 个 不 同 的 概念 , 一 般 一 个 程序 可 包含 多 个 事务 。 在 SQL 语言 中 ， 
事务 定义 的 语句 有 以 下 三 条 。 

(1) BEGIN TRANSACTION: 事务 开始 。 

(2) COMMIT: 事务 提交 。 该 操作 表示 事务 成 功 地 结束 ， 它 将 通知 事务 管理 器 该 事务 的 所 
有 更 新 操作 现在 可 以 被 提交 或 永久 地 保留 。 

(3) ROLLBACK: 事务 回 滚 。 该 操作 表示 事务 非 成 功 地 结束 ， 它 将 通知 事务 管理 器 出 故 
障 了 ， 数 据 库 可 能 处 于 不 一 致 状态 ， 该 事务 的 所 有 更 新 操作 必须 回 滚 或 撤销 。 

事务 具有 原子 性 〈Atomicity )、 一 致 性 〈Consistency)、 隔 离 性 〈Isolation) 和 持久 性 
(CDurability)。 这 4 个 特性 也 称 事务 的 ACID 性 质 。 

(1) 原子 性 。 事 务 是 原子 的 ， 要 么 都 做 ， 要 么 都 不 做 。 

(2) 一 致 性 。 事 务 执行 的 结果 必须 保证 数据 库 从 一 个 一 致 性 状态 变 到 另 一 个 一 致 性 状态 。 
因此 ， 当 数据 库 只 包含 成 功 事务 提交 的 结果 时 ， 称 数据 库 处 于 一 致 性 状态 。 

(3) 隔离 性 。 事 务 相互 隔离 。 当 多 个 事务 并 发 执行 时 ， 任 一 事务 的 更 新 操作 直到 其 成 功 提 
交 的 整个 过 程 ， 对 其 他 事务 都 是 不 可 见 的 。 

(4) 持久 性 。 一 旦 事务 成 功 提交 , 即使 数据 库 崩 溃 ， 其 对 数据 库 的 更 新 操作 也 将 永久 有 效 。 
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9.6.2 数据库 的 备份 与 恢复 


在 数据 库 的 运行 过 程 中 ， 难 免 会 出 现 计算 机 系统 的 软 、 硬 件 故障 ， 这 些 故 障 会 影响 数据 库 
中 数据 的 正确 性 ， 甚 至 破坏 数据 库 ， 使 数据 库 中 的 全 部 或 部 分 数据 丢失 。 因 此 ， 数 据 库 的 关键 
技术 在 于 建立 兄 余 数据 ， 即 备份 数据 。 如 何在 系统 出 现 故障 后 能 够 及 时 地 使 数据 库 恢复 到 故障 
前 的 正确 状态 ， 就 是 数据 库 恢复 技术 。 


1 故障 类 型 


数据 库 中 的 4 类 故障 是 事务 内 部 故障 、 系 统 故障 、 介 质 故 障 及 计算 机 病毒 。 

(1) 事务 内 部 故障 。 事 务 内 部 的 故障 有 的 可 以 通过 事务 程序 本 身 发 现 。 例如， 银行 转账 事 
务 ， 将 账户 A 的 金额 转 于 到 账户 B， 此 时 应 该 将 账户 A 的 余额 -了 ， 将 账户 B 的 余额 +EY。 如 果 
账户 A 的 余额 不 足 ， 那 么 ， 两 个 事务 都 不 做 ， 否 则 都 做 。 但 有 些 是 非 预 期 的 ， 不 能 由 事务 程序 
处 理 ， 例 如 运算 溢出 、 并 发 事务 发 生死 锁 等 。 

(2) 系统 故障 。 通 常 称 为 软 故 障 ， 是 指 造成 系统 停止 运行 的 任何 事件 ， 使 得 系统 要 重新 启 
动 ， 例 如 CPU 故障 、 操 作 系 统 故障 和 突然 停电 等 。 

(3) 介质 故障 。 通 常 称 为 硬 故障 ， 如 磁盘 损坏 、 磁 头 碰撞 和 瞬时 强 磁 干 扰 。 此 类 故障 发 生 
的 几率 小 ， 但 破坏 性 最 大 。 

(4) 计算 机 病毒 。 计 算 机 病毒 是 一 种 人 为 的 故障 和 破坏 ， 是 在 计算 机 程序 中 插入 的 破坏 ， 
计算 机 功能 或 者 数据 可 以 繁殖 和 传播 的 一 组 计算 机 指令 或 程序 代码 。 


2. 备份 方法 


恢复 的 基本 原理 是 “建立 数据 元 余 ”( 重 复 存 储 )。 建 立 元 余数 据 的 方法 是 进行 数据 转 储 和 
登记 日 志文 件 。 数 据 的 转 储 分 为 静态 转 储 和 动态 转 储 、 海 量 转 储 和 增 量 转 储 、 日 志文 件 。 

(1) 静态 转 储 和 动态 转 储 。 静态 转 储 是 指 在 转 储 期 间 不 允许 对 数据 库 进行 任何 存 取 、 修 改 
操作 ;动态 转 储 是 在 转 储 期 间 允 许 对 数据 库 进 行 存 取 、 修 改 操 作 。 因 此 ， 转 储 和 用 户 事务 可 并 
发 执行 。 

(2) 海量 转 储 和 增 量 转 储 。 海量 转 储 是 指 每 次 转 储 全 部 数据 ， 增 量 转 储 是 指 每 次 只 转 储 上 
次 转 储 后 更 新 过 的 数据 。 

(3) 日 志文 件 。 在 事务 处 理 的 过 程 中 , DBMS 把 事务 开始 、 事 务 结束 以 及 对 数据 库 的 插入 、 
删除 和 修改 的 每 一 次 操作 写 入 日 志文 件 。 一 旦 发 生 故 障 ，DBMES 的 恢复 子 系统 利用 日 志文 件 撤 
销 事务 对 数据 库 的 改变 ， 回 退 到 事务 的 初始 状态 。 因 此 ，DBMS 利用 日 志文 件 来 进行 事务 故障 
恢复 和 系统 故障 恢复 ， 并 可 协助 后 备 副 本 进行 介质 故障 恢复 。 
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3. 恢复 


事务 恢复 有 以 下 3 个 步骤 。 

(1) 反 向 扫描 文件 日 志 〈 即 从 最 后 向 前 扫描 日 志文 件 )， 查 找 该 事务 的 更 新 操作 。 

(2) 对 事务 的 更 新 操作 执行 逆 操 作 。 

(3) 继续 反 向 扫描 日 志文 件 ， 查 找 该 事务 的 其 他 更 新 操作 ， 并 做 同样 的 处 理 ， 直 到 事务 的 
开始 标志 。 


4. 数据库 镜 像 


为 了 避免 磁盘 介质 出 现 故障 影响 数据 库 的 可 用 性 ， 许 多 DBMS 提供 数据 库 镜 像 功能 用 于 
数据 库 恢 复 。 需 要 说 明 的 是 ， 数 据 库 镜像 是 通过 复制 数据 实现 的 ， 但 频繁 地 复制 数据 会 降低 系 
统 的 运行 效率 。 因 此 ， 在 实际 应 用 中 往往 对 关键 的 数据 和 日 志文 件 镜像 。 


9.6.3 ”并 发 控制 


所 谓 并 发 操作 ， 是 指 在 多 用 户 共享 的 系统 中 许多 用 户 可 能 同时 对 同一 数据 进行 操作 。 并 发 
操作 带 来 的 问题 是 数据 的 不 一 致 性 ， 主 要 有 三 类 : 丢失 更 新 、 不 可 重复 读 和 读 脏 数据 。 其 主要 
原因 是 事务 的 并 发 操作 破坏 了 事务 的 隔离 性 。DBMS 的 并 发 控制 子 系统 负责 协调 并 发 事务 的 执 
行 ， 保 证 数据 库 的 完整 性 不 受 破坏 ， 避 免 用 户 得 到 不 正确 的 数据 。 


1. 并 发 操作 带 来 的 问题 


并 发 操作 带 来 的 数据 不 一 致 性 有 三 类 : 丢失 修改 、 不 可 重复 读 和 读 脏 数据 ， 如 图 9-30 所 示 。 

(1) 丢失 修改 。 如 图 9-30 (a) 所 示 ， 事 务 Ti、T 都 是 对 数据 A 做 减 1 操作 。 事 务 Ti 在 
时 刻 fs 把 A 修改 后 的 值 15 写 入 数据 库 ， 但 事务 T 在 时 刻 记 再 把 它 对 A 减 1 后 的 值 15 写 入 。 
两 个 事务 都 是 对 A 的 值 进行 减 1 操作 并 且 都 执行 成 功 , 但 A 中 的 值 却 只 减 了 1。 例 如 火车 售票 
系统 ，Ti 与 卫 各 售 出 了 一 张 票 ， 但 数据 库 里 的 存 票 却 只 减 了 一 张 , 造成 数据 的 不 一 致 。 原 因 在 
于 Ti 事务 对 数据 库 的 修改 被 事务 覆盖 而 丢失 了 ， 破 坏 了 事务 的 隔离 性 。 

(2) 不 可 重复 读 。 如 图 9-30 (b) 所 示 ， 事 务 T 读 取 A、B 的 值 后 进行 运算 ， 事 务 T 在 6 
时 刻 对 B 的 值 做 了 修改 以 后 , 事务 T 又 重新 读 取 A、B 的 值 再 运算 ， 同 一 事务 内 对 同一 组 数据 
的 相同 运算 结果 不 同 ， 显 然 与 事实 不 相符 。 同 样 是 事务 T 干 扰 了 事务 Ti 的 独立 性 。 

(3) 读 脏 数据 。 如 图 9-30 (c) 所 示 ， 事 务 Ti 对 数据 C 修改 之 后 ， 在 时 刻 事务 T, 读 取 
修改 后 的 C 值 做 处 理 ， 之 后 事务 Ti 回 滚 ， 数 据 C 恢复 了 原来 的 值 ， 事 务 T; 对 C 所 做 的 处 理 是 
无 效 的 ， 它 读 的 是 被 丢掉 的 垃圾 值 。 
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read(A)[16] read(A)[50] read(C)[100] 
击 read(A)[16] read(B)[100] C=C*2[200] 
& C=A+B[150] write(C)[200] 
ta read(B)[100] read(C)[200] 
右 write(A)[15] B=B*2[200] 
‘is write(B)[200] 
hh write(A)[15] ROLLBACK 
四 read(A)[50] (C=100) 
to read(B)[200] 
tio C=A+B[250] 
hn (验算 不 对 》 

(a) 丢失 修改 (b) 不 可 重复 读 (c) 读 脏 数据 


图 9-30 3 种 数据 不 一 致 性 


通过 以 上 3 个 例子 ,在 事务 并 行 处 理 的 过 程 中 对 相同 数据 进行 访问 导致 了 数据 的 不 一 致 性 ， 
解决 该 问题 可 以 从 保证 事务 的 隔离 性 入 手 。 


2. 并 发 控制 技术 


并 发 控制 的 主要 技术 是 封锁 。 基 本 封锁 的 类 型 有 排 它 锁 (简称 义 锁 或 写 锁 ) 和 共享 锁 ( 简 
称 S 锁 或 读 锁 )。 

1) 封锁 

(1) 排 它 锁 。 若 事务 T 对 数据 对 象 A 加 上 入 锁 ， 则 只 允许 工读 取 和 修改 A， 其 他 事务 都 
不 能 再 对 A 加 任何 类 型 的 锁 ， 直 到 工 释 放 A 上 的 锁 。 

(2) 共享 锁 。 若 事务 T 对 数据 对 象 A 加 上 S 锁 ， 则 只 允许 工读 取 A， 但 不 能 修改 A， 其 
他 事务 只 能 再 对 A 加 S 锁 ， 直 到 工 释 放 A 上 的 S 锁 。 这 就 保证 了 其 他 事务 可 以 读 A， 但 在 
释放 A 上 的 S 锁 之 前 不 能 对 A 进行 任何 修改 。 

2) 三 级 封锁 协议 

(1) 一 级 封锁 协议 。 事 务 在 修改 数据 R 之 前 必须 先 对 其 加 X 锁 ， 直 到 事务 结束 才 释 放 。 
事务 结束 包括 正常 结束 (COMMIT) 和 非 正常 结束 (ROLLBACK)。 一 级 封锁 协议 可 以 解决 丢 
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失 更 新 问题 。 

(2) 二 级 封锁 协议 。 在 一 级 封锁 协议 的 基础 上 ,加 上 事务 T 在 读数 据 R 之 前 必须 先 对 其 加 
S 锁 ， 读 完 后 即 可 释放 S 锁 。 二 级 封锁 协议 可 以 解决 读 脏 数据 的 问题 。 但 是 ， 由 于 二 级 封锁 协 
议 读 完了 数据 后 即 可 释放 S 锁 ， 所 以 不 能 保证 可 重复 读 。 

(3) 三 级 封锁 协议 。 在 一 级 封锁 协议 的 基础 上 , 加 上 事务 T 在 读数 据 R 之 前 必须 先 对 其 加 
S 锁 ， 直 到 事务 结束 时 释放 S 锁 。 三 级 封锁 协议 除了 防止 丢失 修改 和 不 读 “ 脏 ”数据 外 ， 还 进 
一 步 防 止 了 不 可 重复 读 。 


3， 活 锁 与 死 锁 


所 谓 活 锁 ， 是 指 当 事务 Ti 封锁 了 数据 R 时 ， 事 务 T 请 求 封锁 数据 R， 于 是 T 等待， 当 
Ti 释放 了 R 上 的 封锁 后 ， 系 统 首先 批准 了 Ts 请求， 于 是 T, 仍 等 待 ， 当 T 释 放 了 R 上 的 封锁 
后 ， 又 批准 了 Ta 请 求 ， 依 此 类 推 ， 使 得 T 可 能 永远 等 待 的 现象 。 

所 谓 死 锁 ， 是 指 两 个 以 上 的 事务 分 别 请 求 封锁 对 方 已 经 封锁 的 数据 ， 导 致 了 长 期 等 待 而 无 
法 继续 运行 下 去 的 现象 。 

4. 并 发 调度 的 可 串 行 性 


多 个 事务 的 并 发 执行 是 正确 的 ， 当 且 仅 当 其 结果 与 某 一 次 序 串 行 地 执行 它们 时 的 结果 相 
同 ， 称 这 种 调度 策略 是 可 串 行 化 的 调度 。 

可 串 行 性 是 并 发 事务 正确 性 的 准则 ， 按 这 个 准则 规定 ， 一 个 给 定 的 并 发 调度 ， 当 且 仅 当 它 
是 可 串 行 化 的 才 认 为 是 正确 调度 。 


S， 两 段 封 锁 协议 


所 谓 两 段 封锁 协议 ， 是 指 所 有 事务 必须 分 两 个 阶段 对 数据 项 加 锁 和 解锁 。 即 事务 分 两 个 阶 
段 ， 第 一 阶段 是 获得 封锁 ， 事 务 可 以 获得 任何 数据 项 上 的 任何 类 型 的 锁 ， 但 不 能 释放 ;第 二 阶 
段 是 释放 封锁 ， 事 务 可 以 释放 任何 数据 项 上 的 任何 类 型 的 锁 ， 但 不 能 申请 。 

6. 封锁 的 粒度 


封锁 对 象 的 大 小 称 为 封锁 的 粒度 。 封 锁 的 对 象 可 以 是 多 辑 单元 〈 如 属性 、 元 组 、 关 系 、 索 
引 项 、 整 个 索引 甚至 整个 数据 库 )， 也 可 以 是 物理 单元 (如 数据 页 或 索引 页 )。 
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计算 机 网 络 是 由 多 台 计 算 机 组 成 的 系统 , 与 传统 的 单机 系统 、 多 机 系统 相 比 有 很 大 的 区 别 。 
计算 机 网 络 的 结构 、 功 能 、 组 成 以 及 实现 技术 更 复杂 ， 维 护 起 来 难度 更 大 。 本 章 简要 介绍 计算 
机 网 络 的 体系 结构 、 网 络 应 用 、 网 络 互 连 设备 、 网 络 构建 、 网 络 协议 、 网 络 应 用 、 信 息 安全 和 
安全 方面 的 基本 内 容 。 


10.1 网 络 概述 


计算 机 网 络 是 计算 机 技术 与 通信 技术 相 结合 的 产物 ， 它 实现 了 远程 通信 、 远 程 信息 处 理 和 
资源 共享 。 经 过 几 十 年 的 发 展 ， 计 算 机 网 络 已 由 早期 的 “终端 -计算 机 网 ”“ 计 算 机 -计算 机 网 ” 
成 为 现代 具有 统一 网 络 体系 结构 的 计算 机 网 络 。 


10.1.1 计算 机 网 络 的 概念 


1. 计算 机 网 络 的 发 展 


计算 机 网 络 是 计算 机 技术 与 通信 技术 日 益 发 展 和 密切 结合 的 产物 , 它 的 发 展 过 程 大 致 可 以 
划分 为 以 下 4 个 阶段 。 

1) 具有 通信 功能 的 单机 系统 

该 系统 又 称 终端 -计算 机 网 络 ， 是 早期 计算 机 网 络 的 主要 形式 。 它 将 一 台 计 算 机 经 通信 线 
路 与 若干 终端 直接 相连 。 美 国 于 20 世纪 50 年 代 建 立 的 半自动 地 面 防空 系统 SAGE 就 属于 这 一 
类 网 络 。 它 把 远 距 离 的 雷达 和 其 他 测量 控制 设备 的 信息 通过 通信 线路 送 到 一 台 旋 风 型 计算 机 上 
进行 处 理 和 控制 ， 首 次 实现 了 计算 机 技术 与 通信 技术 的 结合 。 

2) 具有 通信 功能 的 多 机 系统 

对 终端 -计算 机 网 络 进行 改进 : 在 主 计 算 机 的 外 围 增加 了 一 台 计 算 机 ， 专 门 用 于 处 理 终端 
的 通信 信息 及 控制 通信 线路 ， 并 能 对 用 户 的 作业 进行 某 些 预 处 理 操作 ， 这 人 台 计算 机 称 为 “前 端 
处 理 机 ”或 “通信 控制 处 理 机 ”。 在 终端 设备 较 集中 的 地 方 设置 一 台 集 中 器 ， 终 端 通过 低速 线 
路 先 汇集 到 集中 器 上 ， 然 后 再 用 高 速 线路 将 集中 器 连 到 主机 上 ， 这 就 形成 了 多 机 系统 。 

3) 以 共享 资源 为 目的 的 计算 机 网 络 

具有 通信 功能 的 多 机 系统 是 计算 机 -计算 机 网 络 ， 它 是 由 若干 台 计 算 机 互 连 的 系统 ， 即 利 
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用 通信 线路 将 多 台 计 算 机 连接 起 来 ， 在 计算 机 之 间 进 行 通信 。 该 网 络 有 两 种 结构 形式 : 一 种 形 
式 是 主 计 算 机 通过 通信 线路 直接 互 连 的 结构 ， 其 中 主 计算 机 同时 承担 数据 处 理 和 通信 工作 ; 另 
一 种 形式 是 通过 通信 控制 处 理 机 间接 地 把 各 主 计算 机 连接 的 结构 ， 其 中 通信 处 理 机 和 主 计算 机 
分 工 不 同 ， 前 者 负责 网 络 上 各 主 计算 机 间 的 通信 处 理 和 控制 ， 后 者 是 网 络 资源 的 拥有 者 ， 负 责 
数据 处 理 ， 它 们 共同 组 成 资源 共享 的 计算 机 网 络 。20 世纪 70 年 代 ， 美 国 国防 部 高 级 研究 计划 
局 所 研制 的 ARPANET 是 计算 机 -计算 机 网 络 的 典型 代表 。 最 初 该 网 络 仅 由 4 台 计 算 机 连接 而 成 ， 
到 1975 年 , 已 连接 100 多 台 不 同型 号 的 大 型 计算 机 。ARPANET 成 为 第 一 个 完善 地 实现 分 布 式 
资源 共享 的 网 络 ， 为 计算 机 网 络 的 发 展 葛 定 了 基础 。 

在 这 期 间 ， 国 际 标准 化 组 织 (ISO) 提出 了 开放 系统 互 连 参 考 模型 OSIURM (Open System 
Interconnection Reference Model)。 该 模型 定义 了 异种 机 连 网 所 应 遵循 的 框架 结构 。OSIRM 很 
快 得 到 了 国际 上 的 认可 ， 并 被 许多 厂商 接受 。 由 此 使 计算 机 网 络 的 发 展 进入 了 新 的 阶段 。 

4) 以 局 域 网 及 因特网 为 支撑 环境 的 分 布 式 计算 机 系统 

局 域 网 是 继 远程 网 之 后 发 展 起 来 的 ， 它 继承 了 远程 网 的 分 组 交换 技术 和 计算 机 的 IO 总 线 
结构 技术 。 局 域 网 的 发 展 也 促使 计算 机 网 络 的 模式 发 生 了 变革 ， 即 由 早期 的 以 大 型 机 为 中 心 的 
集中 式 模式 转变 为 由 微机 构成 的 分 布 式 计算 机 模式 。 

计算 机 网 络 的 定义 随 网 络 技术 的 更 新 可 从 不 同 的 角度 给 予 描述 。 目 前 ， 人 们 已 公认 的 有 关 
计算 机 网 络 的 定义 是 利用 通信 设备 和 线路 将 地 理 位 置 分 散 的 、 功 能 独立 的 自主 计算 机 系统 或 由 
计算 机 控制 的 外 部 设备 连接 起 来 ， 在 网 络 操作 系统 的 控制 下 ， 按 照 约定 的 通信 协议 进行 信息 交 
换 ， 实 现 资 源 共享 的 系统 。 

该 定义 中 涉及 的 “资源 ”应 该 包括 硬件 资源 ‘CPU、 大 容量 的 磁盘 、 光 得 以 及 打印 机 等 ) 
和 软件 资源 (语言 编译 器 、 文 本 编辑 器 、 各 种 软件 工具 和 应 用 程序 等 )。 


2. 计算 机 网 络 的 功能 


计算 机 网 络 提供 的 主要 功能 有 如 下 。 

(1) 数据 通信 。 通 信 或 数据 传输 是 计算 机 网 络 的 主要 功能 之 一 ， 用 于 在 计算 机 系统 之 间 传 
送 各 种 信息 。 利 用 该 功能 ， 地 理 位置 分 散 的 生产 单位 和 业务 部 门 可 通过 计算 机 网 络 连 接 在 一 起 
进行 集中 控制 和 管理 ， 也 可 以 通过 计算 机 网 络 传送 电子 邮件 ， 发 布 新 闻 消 息 及 进行 电子 数据 交 
换 ， 极 大 地 方便 了 用 户 ， 提 高 了 工作 效率 。 

(2) 资源 共享 。 资 源 共享 是 计算 机 网 络 最 有 吸引 力 的 功能 。 通 过 资源 共享 ， 可 使 网 络 中 分 
散在 异地 的 各 种 资源 互通 有 无 ， 分 工 协作 ， 从 而 大 大 提高 系统 资源 的 利用 率 。 资 源 共 享 包 括 软 
件 资源 共享 和 硬件 资源 共享 。 

(3) 负载 均衡 。 在 计算 机 网 络 中 可 进行 数据 的 集中 处 理 或 分 布 式 处 理 ， 一 方面 可 以 通过 计 
算 机 网 络 将 不 同 地 点 的 主机 或 外 设 采集 到 的 数据 信息 送 往 一 台 指 定 的 计算 机 ， 在 此 计算 机 上 对 
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数据 进行 集中 和 综合 处 理 ， 通 过 网 络 在 各 计算 机 之 间 传 送 原始 数据 和 计算 结果 ; 另 一 方面 ， 当 
网 络 中 的 某 台 计算 机 任务 过 重 时 ， 可 将 任务 分 派 给 其 他 空闲 的 多 台 计 算 机 ， 使 多 台 计 算 机 相互 
协作 ， 均 衡 负载 ， 共 同 完成 任务 。 

(4) 高 可 靠 性 。 高 可 靠 性 指 在 计算 机 网 络 中 的 各 人 台 计算 机 可 以 通过 网 络 彼此 互 为 后 备 机 ， 
一 旦 某 台 计算 机 出 现 故 障 , 故障 机 的 任务 就 可 由 其 他 计算 机 代为 处 理 , 从 而 提高 系统 的 可 靠 性 。 
并 且 避 免 了 单机 无 后 备 使 用 的 情况 下 ， 计 算 机 出 现 故 障 而 导致 系统 瘫痪 的 现象 ， 从 而 大 大 提高 
了 系统 的 可 靠 性 。 

借助 于 计算 机 网 络 ， 在 各 种 功能 软件 的 支持 下 ， 人 们 可 以 进行 高 速 的 异地 电子 信息 交换 ， 
并 获得 了 多 种 服务 ， 如 新 闻 浏 览 和 信息 检索 、 传 送 电子 邮件 、 多 媒体 电信 服务 、 远 程 教育 、 网 
上 和 营销、 网 上 娱乐 和 远程 医疗 诊断 等 。 

计算 机 网 络 按照 数据 通信 和 数据 处 理 的 功能 可 分 为 两 层 ， 内 层 通 信子 网 和 外 层 资源 子 网 ， 
如 图 10-1 所 示 。 通 信子 网 〈 图 中 虚线 内 ) 的 结 点 计算 机 和 高 速 通信 线路 组 成 独立 的 数据 系统 ， 
承担 全 网 的 数据 传输 、 交 换 、 加 工 和 变换 等 通信 处 理工 作 ， 即 将 一 台 计 算 机 的 输出 信息 传送 给 
另 一 台 计 算 机 。 资 源 子 网 (图 中 点 划 线 内 虚线 外 ) 包括 计算 机 、 终 端 、 通 信子 网 接口 设备 、 外 
部 设备 〈 如 打印 机 、 磁 带 机 和 绘图 机 等 ) 及 各 种 软件 资源 等 ， 它 负责 全 网 的 数据 处 理 和 向 网 络 
用 户 提供 网 络 资源 及 网 络 服务 。 


图 10-1 通信 子 网 和 资源 子 网 关系 图 
了 一 主 计算 机 ， T 一 终端 ; TIP 一 集线器 


通信 子 网 和 资源 子 网 的 划分 ， 完 全 符合 国际 标准 化 组 织 所 制定 的 开放 式 系统 互 连 参 考 模型 
(OSI) 的 思想 。 其 中 ， 通 信子 网 对 应 于 OSI 中 的 低 三 层 〈 物 理 屋 、 数 据 链 路 层 、 网 络 层 )， 而 
资源 子 网 对 应 于 OSI 中 的 高 三 层 〈 会 话 层 、 表 示 层 、 应 用 层 )。 这 种 划分 将 通信 子 网 的 任务 从 
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主机 中 抽取 出 来 ， 由 通信 子 网 中 的 设备 专门 解决 数据 传输 和 通信 控制 问题 。 而 资源 子 网 中 的 计 
算 机 可 集中 精力 处 理 数据 ， 从 而 提高 主机 效率 和 网 络 的 整体 性 能 。 


10.1.2 ”计算 机 网 络 的 分 类 


计算 机 网 络 的 分 类 方式 很 多 , 按照 不 同 的 分 类 原则 , 可 以 得 到 各 种 不 同类 型 的 计算 机 网 络 。 
例如 ， 按 通信 距离 可 分 为 广域网 、 局 域 网 和 城 域 网 ， 按 信息 交换 方式 可 分 为 电路 交换 网 、 分 组 
交换 网 和 综合 交换 网 ， 按 网 络 拓扑 结构 可 分 为 星 型 网 、 树 型 网 、 环 型 网 和 总 线 网 ， 按 通信 介质 
可 分 为 双 绞 线 网 、 同 轴 电 缆 网 、 光 纤 网 和 卫星 网 等 ， 按 传输 带宽 可 分 为 基带 网 和 宽带 网 ， 按 使 
用 范围 可 分 为 公用 网 和 专用 网 ， 按 速率 可 分 为 高 速 网 、 中 速 网 和 低速 网 ， 按 通信 传播 方式 可 分 
为 广播 式 和 点 到 点 式 。 

这 里 主要 介绍 根据 计算 机 网 络 的 覆盖 范围 和 通信 终端 之 间 相 隔 的 距离 不 同 将 其 分 为 局 域 
网 、 城 域 网 和 广域网 三 类 的 情况 ， 各 类 网 络 的 特征 参数 如 表 10-1 所 示 。 


表 10-1 各 类 网 络 的 特征 参数 
网 络 分 类 计算 机 分 布 范 轩 传输 速率 范围 


局 域 风 TE 4Mbps 一 1Gbps 
城 域 网 S50Kbps~100Mbps 


广域网 全 | 国家 或 全 球 | 9.6Kbps~45Mbps 
1. 局 域 网 


局 域 网 (Local Area Network，LAN) 是 指 传输 距离 有 限 、 传 输 速 度 较 高 、 以 共享 网 络 资源 
为 目的 的 网 络 系统 。 由 于 局 域 网 投资 规模 较 小 ， 网 络 实现 简单 ， 故 新 技术 易于 推广 。 局 域 网 技 
术 与 广域网 相 比 发 展 迅速 。 局 域 网 的 特点 如 下 : 

(1) 分 布 范围 有 限 。 加 入 局 域 网 中 的 计算 机 通常 处 在 几 千 米 的 距离 之 内 。 通 常 ， 它 分 布 在 
一 个 学 校 、 一 个 企业 单位 ， 为 本 单位 使 用 。 一 般 称 为 “园区 网 ”或 “校园 网 ”。 

(2) 有 较 高 的 通信 带宽 ， 数 据 传输 率 高 。 一 般 为 IMbps 以 上 ， 最 高 已 达 1000Mbps。 

(3) 数据 传输 可 靠 ， 误 码 率 低 。 误 码 率 一 般 为 10 “一 10“。 

(4) 通常 采用 同 轴 电线 或 双 绞 线 作为 传输 介质 ， 跨 楼 寓 时 使 用 光纤 。 

(5) 拓扑 结构 简单 、 简 洁 ， 大 多 采用 总 线 、 星 型 和 环 型 等 ， 系 统 容易 配置 和 管理 。 网 上 的 
计算 机 一 般 采 用 多 路 控制 访问 技术 或 令 牌 技术 访问 信道 

(6) 网 络 的 控制 一 般 趋 向 于 分 布 式 ， 从 而 减少 了 对 某 个 结 点 的 依赖 ， 避 免 并 减 小 了 一 
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点 故障 对 整个 网 络 的 影响 。 

(7) 通常 ， 网 络 归 单 一 组 织 所 拥有 和 使 用 ， 不 受 任何 公共 网 络 管理 机 构 的 规定 约束 ， 容 易 
进行 设备 的 更 新 和 新 技术 的 应 用 ， 以 不 断 增 强 网 络 功能 。 

2. 城 域 网 


城 域 网 (Metropolitan Area Network，MAN) 是 规模 介 于 局 域 网 和 广域网 之 间 的 一 种 较 大 范 
围 的 高 速 网 络 ， 一 般 覆 盖 临 近 的 多 个 单位 和 城市 ， 从 而 为 接 入 网 络 的 企业 、 机 关 、 公 司 及 社会 
单位 提供 文字 、 声 音 和 图 像 的 集成 服务 。 城 域 网 规范 由 下 EE 802.6 协议 定义 。 


3， 广域网 


广域网 (Wide Area Network，WAN) 又 称 远程 网 ， 它 是 指 履 盖 范 围 广 、 传 输 速率 相对 较 低 、 
以 数据 通信 为 主要 目的 的 数据 通信 网 。 广 域 网 最 根本 的 特点 如 下 。 

(1) 分 布 范围 广 。 加 入 广域网 中 的 计算 机 通常 处 在 从 数 千 米 到 数 千 千 米 的 地 方 。 因 此 ， 网 
络 所 涉及 的 范围 可 为 市 、 地 区 、 省 、 国 家 乃至 世界 。 

(2) 数据 传输 率 低 。 一 般 为 几 十 光 位 每 秒 以 下 。 

(3) 数据 传输 的 可 靠 性 随 着 传输 介质 的 不 同 而 不 同 ， 若 用 光纤 ， 误 码 率 一 般 在 10“ 一 10 7 
之 间 。 

(4) 广域网 常常 借用 传统 的 公共 传输 网 来 实现 ， 因 为 单独 建造 一 个 广域网 极其 昂贵 。 

(5) 拓扑 结构 较为 复杂 ， 大 多 采用 “分 布 式 网 络 ” 即 所 有 计算 机 都 与 交换 结 点 相连 ， 从 
而 实现 网 络 中 的 任何 两 台 计 算 机 都 可 以 进行 通信 。 

广域网 的 布局 不 规则 ， 使 得 网 络 的 通信 控制 比较 复杂 。 尤 其 是 使 用 公共 传输 网 ， 要 求 连接 
到 网 上 的 任何 用 户 都 必须 严格 遵守 各 种 标准 和 规程 。 设 备 的 更 新 和 新 技术 的 引用 难度 较 大 。 广 
域 网 可 将 一 个 集团 公司 、 团 体 或 一 个 行业 的 各 处 部 门 和 子 公司 连 接 起 来 。 这 种 网 络 一 般 要 求 兼 
容 多 种 网 络 系 统 〈 异 构 网 络 )。 


10.1.3 网络 的 拓扑 结构 


网 络 拓扑 结构 是 指 网 络 中 通信 线路 和 结 点 的 几何 排序 ， 用 于 表示 整个 网 络 的 结构 外 貌 ， 反 
映 各 结 点 之 间 的 结构 关系 。 它 影响 着 整个 网 络 的 设计 、 功 能 、 可 靠 性 和 通信 费用 等 重要 方面 ， 
是 计算 机 网 络 十 分 重要 的 要 素 。 常 用 的 网 络 拓扑 结构 有 总 线 型 、 星 型 、 环 型 、 树 型 和 分 布 式 结 
构 等 。 
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1. 总 线 型 结构 


总 线 型 拓扑 结构 如 图 10-2(a) 所 示 ， 其 特点 为 只 有 一 条 双向 通路 , 便于 进行 广播 式 传送 信 
息 ; 总 线 型 拓扑 结构 属于 分 布 式 控制 ， 无 须 中 央 处 理 器 ， 故 结构 比较 简单 ， 结 点 的 增 、 删 和 位 
置 的 变动 较 容易 ， 变 动 中 不 影响 网 络 的 正常 运行 ， 系 统 扩充 性 能 好 ; 结 点 的 接口 通常 采用 无 源 
线路 ， 系 统 可 靠 性 高 ; 设备 少 、 价 格 低 、 安 装 使 用 方便 ; 由 于 电气 信号 通路 多 ， 干 扰 较 大 ， 因 
此 对 信号 的 质量 要 求 高 ， 负 载重 时 ， 线 路 的 利用 率 较 低 ， 网 上 的 信息 延迟 时 间 不 确定 ， 故 障 隔 
离 和 检测 困难 。 


2. 星 型 结构 


在 星 型 结构 中 ， 使 用 中 央 交 换 单 元 以 放射 状 连接 到 网 中 的 各 个 结 点 ， 如 图 10-2 (b) 所 示 。 
中 央 单 元 采用 电路 交换 方式 以 建立 所 希望 通信 的 两 结 点 间 专 用 的 路 径 。 通 常用 双 绞 线 将 结 点 与 
中 央 单 元 进行 连接 。 其 特点 为 维护 管理 容易 ， 重 新 配置 灵活 ;故障 隔离 和 检测 容易 ;网 络 延迟 
时 间 短 ; 各 结 点 与 中 央 交 换 单元 直接 连通 ， 各 结 点 之 间 通信 必须 经 过 中 央 单 元 转换 ， 网 络 共享 
能 力 差 : 线路 利用 率 低 ， 中 央 单 元 负荷 重 。 

3。 环 型 结构 


环 型 结构 的 信息 传输 线路 构成 一 个 封闭 的 环 型 ， 各 结 点 通过 中 继 器 连 入 网 内 ， 各 中 继 器 间 
首尾 相 接 ， 信 息 单 向 沿 环 路 逐 点 传送 ， 如 图 10-2(e》 所 示 。 其 特点 为 信息 的 流动 方向 是 国定 
的 ， 两 个 结 点 仅 有 一 条 通路 ， 路 径 控 制 简单 有 过 路 设备 ， 结 点 一 旦 发 生 故 障 ， 系 统 自动 旁 路 ， 
可 靠 性 高 ， 信 息 要 串 行 穿 过 多 个 结 点 ， 在 网 中 结 点 过 多 时 传输 效率 低 ， 系 统 响应 速度 慢 ， 由 于 
环 路 寺 闭 ， 扩 充 较 难 。 

4. 树 型 结构 

树 型 结构 是 总 线 型 结构 的 扩充 形式 ， 传 输 介质 是 不 封闭 的 分 支 电缆 ， 如 图 10-2 (d) 所 示 。 
它 主 要 用 于 多 个 网 络 组 成 的 分 级 结构 中 ， 其 特点 同 总 线 型 网 。 

5. 分布 式 结构 


分 布 式 结构 无 严格 的 布点 规定 和 形状 ， 各 结 点 之 间 有 多 条 线路 相连 ， 如 图 10-2 〈e) 所 示 。 
其 特点 为 有 较 高 的 可 靠 性 ， 当 一 条 线路 有 故障 时 ， 不 会 影响 整个 系统 工作 ; 资源 共享 方便 ， 网 
络 响应 时 间 短 ; 由 于 结 点 与 多 个 结 点 连接 ， 故 结 点 的 路 由 选择 和 流量 控制 难度 大 ， 管 理 软件 复 
杂 ; 硬件 成 本 高 。 
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(d) 树 型 (e) 分 布 式 
图 10-2 常用 的 网 络 拓扑 结构 


广域网 与 局 域 网 所 使 用 的 网 络 拓扑 结构 有 所 不 同 ， 广 域 网 多 用 分 布 式 或 树 型 结构 ， 而 局 域 
网 常 使 用 总 线 型 、 环 型 、 星 型 或 树 型 结构 。 


10.1.4 ”ISO/OSI 网 络 体系 结构 


计算 机 网 络 是 相当 复杂 的 系统 ， 相 互通 信 的 两 个 计算 机 系统 必须 高 度 协调 才能 正常 工作 。 
为 了 设计 这 样 复杂 的 计算 机 网 络 ， 人 们 提出 了 将 网 络 分 层 的 方法 。 分 层 可 将 庞大 而 复杂 的 问题 
转化 为 若干 较 小 的 局 部 问题 进行 处 理 ， 从 而 使 问题 简单 化 。 

国际 标准 化 组 织 在 1977 年 成 立 了 一 个 分 委员 会 专门 研究 网 络 通信 的 体系 结构 问题 ， 并 提 
出 了 开放 系统 互 连 参考 模型 ， 它 是 一 个 定义 异种 计算 机 连接 标准 的 框架 结构 。OSI 为 连接 分 布 
式 应 用 处 理 的 “开放 ”系统 提供 了 基础 。 所 谓 “ 开 放 ”， 是 指 任何 两 个 系统 只 要 遵守 参考 模型 
和 有 关 标 准 就 能 够 进行 互 连 。OSI 采用 了 层次 化 结构 的 构造 技术 。 

ISO 分 委员 会 的 任务 是 定义 一 组 层次 和 每 一 层 所 完成 的 功能 和 服务 。 层 次 的 划分 应 当 从 风 
辑 上 将 功能 分 组 ， 层 次 应 该 足够 多 ， 应 使 每 一 层 小 到 易于 管理 的 程度 ， 但 也 不 能 太 多 ， 否 则 汇 
集 各 层 的 处 理 开销 太 大 。 


1. ISO/OSI 参考 模型 


ISO/OSI 的 参考 模型 共有 7 层 , 如 图 10-3 所 示 。 由 低层 至 高 层 分 别 为 物理 层 、 数 据 链 路 层 、 
网 络 层 、 传 输 层 、 会 话 层 、 表 示 层 和 应 用 层 。 


Ez 
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图 10-3 OSI 参考 模型 


OSI 参考 模型 具有 以 下 特性 。 

(1) 它 是 一 种 将 异 构 系 统 互 连 的 分 层 结构 。 

(2) 提供 了 控制 互 连 系统 交互 规则 的 标准 框架 。 

(3) 定义 了 一 种 抽象 结构 ， 而 并 非 具体 实现 的 描述 。 

(4) 不 同系 统 上 相同 层 的 实体 称 为 同等 层 入 

(5) 同等 层 实 体 之 间 的 通信 由 该 层 的 协议 管理 。 

(6) 相 邻 层 间 的 接口 定义 了 原 语 操作 和 低层 向 高 层 提供 的 服务 。 

(7) 所 提供 的 公共 服务 是 面向 连接 的 或 无 连接 的 数据 服务 。 

(8) 直接 的 数据 传送 仅 在 最 低层 实现 。 

(9) 每 层 完成 所 定义 的 功能 ， 修 改 本 层 的 功能 并 不 影响 其 他 层 。 

OSIRM 中 的 1 一 3 层 主 要 负责 通信 功能 ， 一 般 称 为 通信 子 网 层 。 上 三 层 〈 即 5~7 层 ) 属 
于 资源 子 网 的 功能 范畴 ， 称 为 资源 子 网 层 。 传 输 层 起 着 衔接 上 、 下 三 层 的 作用 。 对 各 层 的 说 明 
如 下 。 

(1) 物理 层 (Physical Layer)。 物 理 层 提供 为 建立 、 维 护 和 拆除 物理 链 路 所 需 的 机 械 、 电 
气 、 功 能 和 规程 的 特性 ， 提 供 有 关 在 传输 介质 上 传输 非 结 构 的 位 流 及 物理 链 路 故障 检测 指示 。 

用 户 要 传递 信息 就 要 利用 一 些 物 理 媒体 ， 如 双 绞 线 、 同 轴 电 缆 等 ， 但 具体 的 物理 媒体 并 不 
在 OSI 的 7 层 之 内 ， 有 人 把 物理 媒体 当 作 第 0 层 ， 物 理 层 的 任务 就 是 为 它 的 上 一 层 提 供 一 个 物 
理 连接 ， 以 及 它们 的 机 械 、 电 气 、 功 能 和 过 程 特 性 。 例 如 规定 使 用 电缆 和 接头 的 类 型 ， 传 送信 
号 的 电压 等 。 在 这 一 层 ， 数 据 还 没有 被 组 织 ， 仅 作为 原始 的 位 流 或 电气 电压 处 理 ， 单 位 是 位 。 
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(2) 数据 链 路 层 (Data Link Layer)。 数 据 链 路 层 负 责 在 两 个 相 邻 结 点 间 的 线路 上 无 差错 地 
传送 以 帧 为 单位 的 数据 , 并 进行 流量 控制 。 每 一 帧 包括 一 定数 量 的 数据 和 一 些 必要 的 控制 信息 。 
和 物理 层 相似 ， 数 据 链 路 层 要 负责 建立 、 维 持 和 释放 数据 链 路 的 连接 。 在 传送 数据 时 ， 如 果 接 
收 点 检测 到 所 传 数据 中 有 差错 ， 就 要 通知 发 送 方 重 发 这 一 帧 。 

(3) 网 络 层 (Network Layer)。 网 络 层 为 传输 层 实体 提供 端 到 端的 交换 网 络 数据 功能 ， 使 
得 传输 层 摆脱 路 由 选择 、 交 换 方 式 和 拥挤 控制 等 网 络 传输 细节 ; 可 以 为 传输 层 实体 建立 、 维 持 
和 拆除 一 条 或 多 条 通信 和 路径， 对 网 络 传输 中 发 生 的 不 可 恢复 的 差错 予以 报告 。 

在 计算 机 网 络 中 进行 通信 的 两 个 计算 机 之 间 可 能 会 经 过 很 多 个 数据 链 路 ， 也 可 能 还 要 经 过 
很 多 通信 子 网 。 网 络 层 的 任务 就 是 选择 合适 的 网 间 路 由 和 交换 结 点 ， 确 保 数据 及 时 传送 。 网 络 
层 将 数据 链 路 层 提供 的 帧 组 成 数据 包 ， 包 中 封装 有 网 络 层 包 头 ， 其 中 含有 逻辑 地 址 信息 ， 即 源 
站 点 和 目的 站 点 的 网 络 地 址 。 

(4) 传输 层 〈Transport Layer)。 传 输 层 为 会 话 层 实体 提供 透明 、 可 靠 的 数据 传输 服务 ， 保 
证 端 到 端的 数据 完整 性 ， 选择 网 络 层 能 提供 最 适宜 的 服务 ， 提 供 建立 、 维 护 和 拆除 传输 连接 功 
能 。 传 输 层 根据 通信 子 网 的 特性 最 佳 地 利用 网 络 资源 ， 为 两 个 端 系统 〈 也 就 是 源 站 和 目的 站 ) 
的 会 话 层 之 间 提 供 建立 、 维 护 和 取消 传输 连接 的 功能 ， 并 以 可 靠 和 经 济 的 方式 传输 数据 。 在 这 
一 层 ， 信 息 的 传送 单位 是 报 文 。 

(5) 会 话 层 (Session Layer)。 会 话 层 为 彼此 合作 的 表示 层 实体 提供 建立 、 维 护 和 结束 会 话 
连接 的 功能 ， 完 成 通信 进程 的 逻辑 名 字 与 物理 名 字 间 的 对 应 ， 提 供 会 话 管理 服务 。 

这 一 层 也 可 以 称 为 会 话 层 或 对 话 层 ， 在 会 话 层 及 以 上 的 高 层 中 ， 数 据 传 送 的 单位 不 再 另外 
命名 ， 统 称 为 报 文 。 会 话 层 不 参与 具体 的 传输 ， 它 提供 包括 访问 验证 和 会 话 管理 在 内 的 建立 和 
维护 应 用 之 间 通 信 的 机 制 。 例 如 服务 器 验证 用 户 登录 便 是 由 会 话 层 完成 的 。 

(6) 表示 层 〈Presentation Layer)。 表 示 层 为 应 用 层 进程 提供 能 解释 所 交换 信息 含义 的 一 组 
服务 , 即将 要 交换 的 数据 从 适合 于 某 一 用 户 的 抽象 语法 转换 为 适合 于 OSI 系统 内 部 使 用 的 传送 
语法 ;提供 格式 化 的 表示 和 转换 数据 服务 。 数 据 的 压缩 、 解 压缩 、 加 密 和 解密 等 工作 都 由 表示 
层 负责 。 

(7) 应 用 层 (Application Layer)。 应 用 层 提 供 OSI 用 户 服 务 ， 即 确定 进程 之 间 通 信 的 性 质 ， 
以 满足 用 户 需要 以 及 提供 网 络 与 用 户 应 用 软件 之 间 的 接口 服务 。 例 如 ， 事 务 处 理 程序 、 电 子 邮 
件 和 网 络 管理 程序 等 。 


2. 参考 模型 的 信息 流向 
如 图 10-4 所 示 ， 设 A 系统 的 用 户 要 向 B 系统 的 用 户 传送 数据 。A 系统 用 户 的 数据 先 送 入 


应 用 层 ， 该 层 给 它 附加 控制 信息 AH ( 头 标 ) 后 ， 送 入 表示 层 。 表 示 层 对 数据 进行 必要 的 变换 
并 加 头 标 PH 后 送 入 会 话 层 。 会 话 层 也 加 头 标 SH 送 入 传输 层 。 传 输 层 将 长 报 文 分 段 后 并 加 头 


加 :5 项 
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标 TH 送 至 网 络 层 。 网 络 层 将 信息 变 成 报 文 分 组 ， 并 加 组 号 NH 送 数据 链 路 层 。 数 据 链 路 层 将 
信息 加 上 头 标 和 尾 标 (DH 及 DT) 变 成 帧 ， 经 物理 层 按 位 发 送 到 对 方 〈(B 系统 )。B 系统 接收 
到 信息 后 , 按照 与 A 系统 相反 的 动作 , 层 层 剥 去 控制 信息 , 最 后 把 原 数据 传送 给 B 系统 的 用 户 。 
可 见 ， 两 系统 中 只 有 物理 层 是 实 通信 ， 其 余 各 层 均 为 虚 通 信 。 因 此 ， 图 10-4 中 只 有 两 物理 层 之 
间 有 物理 连接 ， 其 余 各 层 间 均 无 连 线 。 


和 和 系统 ra EE 
应 用 层 ”| 应 用 协议 一 [4] 到 二 | 应 用 层 
表示 层 | 表示 协议 ”一 [P96] 数据 j= | 表示 层 

| 会 大 层 | 全 话 共 议 一 [SH| 数据 |- | 会 话 层 
传输 层 。 | 传输 协议 ” 一 TH| 数据 = 传输 层 
网 络 层 “ | 网 络 功 议 一 NH| 弛 记 | 网 络 层 

数据 链 路 层 | ”一 DH 区 所 J5T] | 数据 链 路 导 

和 % 屋 | -ee [| 。 物理 层 


=== = = = 


图 10-4 ISO/ OSI RM 内 信息 流动 


10.2 网络 互 连 硬件 


构建 一 个 实际 的 网 络 需要 网 络 的 传输 介质 、 网 络 互 连 设备 作为 支持 ， 本 节 主 要 介绍 构建 网 
络 的 传输 介质 和 互 连 设备 。 


10.2.1 网 络 的 设备 


网 络 互 连 的 目的 是 使 一 个 网 络 的 用 户 能 访问 其 他 网 络 的 资源 ， 使 不 同 网 络 上 的 用 户 能 够 互 
相通 信和 交换 信息 ， 实 现 更 大 范围 的 资源 共享 。 在 网 络 互 连 时 ， 一 般 不 能 简单 地 直接 相连 ， 而 
是 通过 一 个 中 间 设 备 来 实现 。 按 照 ISO/OSI 的 分 层 原 则 ， 这 个 中 间 设 备 要 实现 不 同 网 络 之 间 的 
协议 转换 功能 ， 根 据 它 们 工作 的 协议 层 不 同 进行 分 类 。 网 络 互 连 设 备 可 以 有 中 继 器 〈 实 现 物理 
层 协 议 转换 ， 在 电缆 间 转 发 二 进 制 信 号 )、 网 桥 《〈 实 现 物理 层 和 数据 链 路 层 协议 转换 )、 路 由 器 
(实现 网 络 层 和 以 下 各 层 协 议 转 换 )、 网 关 提 供 从 最 低层 到 传输 层 或 以 上 各 层 的 协议 转换 ) 和 
交换 机 等 。 
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1， 网 络 传输 介质 互 连 设备 

网 络 线路 与 用 户 结 点 具体 连接 时 ， 需 要 网 络 传输 介质 的 互 连 设备 。 如 工 形 头 〈 细 同 轴 电 缆 
连接 器 )、 收 发 器 、RJ-45〔 屏 蔽 或 非 屏蔽 双 绞 线 连接 器 )、RS232 接口 (目前 计算 机 与 线路 接口 
的 常用 方式 )、DB-15 接口 (连接 网 络 接口 卡 的 AUI 接口 )、VB35 同步 接口 (连接 远程 的 高 速 
同步 接口 )、 网 络 接口 单元 和 调制 解 调 器 〈 数 字 信 和 号 与 模拟 信号 转换 器 ) 等 。 


2. 物理 层 的 互 连 设备 


物理 层 的 互 连 设备 有 中 继 器 〈Repeater) 和 集线器 (Hub )。 

1) 中 继 器 

它 是 在 物理 层 上 实现 局 域 网 网 段 互 连 的 ， 用 于 扩展 局 域 网 网 段 的 长 度 。 由 于 中 继 器 只 在 两 
个 局 域 网 网 段 间 实现 电气 信号 的 恢复 与 整形 ， 因 此 它 仅 用 于 连接 相同 的 局 域 段 。 

从 理论 上 说 ， 可 以 用 中 继 器 把 网 络 延长 到 任意 长 的 传输 距离 ， 但 是 ， 局 域 网 中 接 入 的 中 继 
器 的 数量 将 受 时 延 和 衰 耗 的 影响 ,因而 必须 加 以 限制 。 例如 , 在 以 太 网 中 最 多 使 用 4 个 中 继 器 。 
以 太 网 设计 连 线 时 指定 两 个 最 远 用 户 之 间 的 距离 ,包括 用 于 局 域 网 的 连接 电线, 不 得 超过 500m。 
即便 使 用 了 中 继 器 ， 典 型 的 Ethernet 局 域 网 应 用 要 求 从 头 到 尾 整个 路 径 不 超过 1500m。 中 继 器 
的 主要 优点 是 安装 简便 、 使 用 方便 、 价 格 便宜 。 

2) 集线器 

集线器 可 以 看 成 是 一 种 特殊 的 多 路 中 继 器 ， 也 具有 信号 放大 功能 。 使 用 双 绞 线 的 以 太 网 多 
用 Hub 扩大 网 络 ， 同 时 也 使 于 网 络 的 维护 。 以 集线器 为 中 心 的 网 络 的 优点 是 当 网 络 系统 中 某 条 
线路 或 某 结 点 出 现 故障 时 不 会 影响 网 上 其 他 结 点 的 正常 工作 。 集 线 器 可 分 为 无 源 (Passive) 集 
线 器 、 有 源 (Active) 集线器 和 智能 (Intelligent) 集线器 。 

无 源 集线器 只 负责 把 多 段 介质 连接 在 一 起 ， 不 对 信号 做 任何 处 理 ， 每 一 种 介质 段 只 允许 扩 
展 到 最 大 有 效 距离 的 一 半 :， 有 源 集线器 类 似 于 无 源 集线器 ， 但 它 具有 对 传输 信号 进行 再 生 和 放 
大 从 而 扩展 介质 长 度 的 功能 ;智能 集线器 除 具 有 有 源 集线器 的 功能 外 ， 还 可 将 网 络 的 部 分 功能 
集成 到 集线器 中 ， 如 网 络 管理 、 选 择 网 络 传输 线路 等 。 


3。. 数据 链 路 层 的 互 连 设 备 


数据 链 路 层 的 互 连 设备 有 网 桥 〈Bridge) 和 交换 机 (Switch)。 

1) 网 桥 

网 桥 用 于 连接 两 个 局 域 网 网 段 ， 工 作 于 数据 链 路 层 。 网 桥 要 分 析 帧 地 址 字段 ， 以 决定 是 否 
把 收 到 的 帧 转发 到 另 一 个 网 络 段 上 。 确 切 地 说 ， 网 桥 工 作 于 MAC 子 层 ， 只 要 两 个 网 络 的 MAC 
子 层 以 上 的 协议 相同 ， 都 可 以 用 网 桥 互 连 。 
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网 桥 检查 帧 的 源 地 址 和 目的 地 址 ， 如 果 目 的 地 址 和 源 地 址 不 在 同一 个 网 络 段 上 ， 就 把 帧 转 
发 到 另 一 个 网 络 段 上 ; 若 两 个 地 址 在 同一 个 网 络 段 上 ， 则 不 转发 ， 所 以 网 桥 能 起 到 过 滤 帧 的 作 
用 。 网 桥 的 帧 过 滤 特 性 很 有 用 ， 当 一 个 网 络 由 于 负载 很 重 而 性 能 下 降 时 ， 可 以 用 网 桥 把 它 分 成 
两 个 网 络 段 并 使 得 段 间 的 通信 量 保持 最 小 。 例 如 ， 把 分 布 在 两 层 楼 上 的 网 络 分 成 每 层 一 个 网 络 
段 ， 段 中 间 用 网 桥 相 连 ， 这 样 的 配置 可 以 最 大 限度 地 缓解 网 络 通信 繁忙 的 程度 ， 提 高 通信 效率 。 
同时 ， 由 于 网 桥 的 隔离 作用 ， 一 个 网 络 段 上 的 故障 不 会 影响 到 另 一 个 网 络 段 ， 从 而 提高 了 网 络 
的 可 靠 性 。 

2) 交换 机 

交换 机 是 一 个 具有 简化 、 低 价 、 高 性 能 和 高 端口 密集 特点 的 交换 产品 ， 它 是 按 每 一 个 包 中 
的 MAC 地 址 相对 简单 地 决策 信息 转发 ， 而 这 种 转发 决策 一 般 不 考虑 包 中 隐藏 的 更 深 的 其 他 信 
息 。 交换 机 转发 数据 的 延迟 很 小 ,操作 接近 单个 局 域 网 性 能 , 远 远 超过 了 普通 桥接 的 转发 性 能 。 
交换 技术 允许 共享 型 和 专用 型 的 局 域 网 段 进行 带宽 调整 ， 以 减轻 局 域 网 之 间 信 息 流 通 出 现 的 瓶 
颈 问题 。 

交换 机 的 工作 过 程 为 : 当 交 换 机 从 某 一 结 点 收 到 一 个 以 太 网 帧 后 ， 将 立即 在 其 内 存 中 的 地 
址 表 ( 端 口号 一 MAC 地 址 ) 进行 查找 ， 以 确认 该 目的 MAC 的 网 卡 连接 在 哪 一 个 结 点 上 ， 然 后 
将 该 帧 转发 至 该 结 点 。 如 果 在 地 址 表 中 没有 找到 该 MAC 地 址 ， 也 就 是 说 ， 该 目的 MAC 地 址 
是 首次 出 现 ， 交 换 机 就 将 数据 包 广播 到 所 有 结 点 。 拥 有 该 MAC 地 址 的 网 卡 在 接收 到 该 广播 帧 
后 将 立即 做 出 应 答 ， 从 而 使 交换 机 将 其 结 点 的 “MAC 地 址 ”添加 到 MAC 地 址 表 中 。 

交换 机 的 3 种 交换 技术 : 端口 交换 〈 用 于 将 以 太 模 块 的 端口 在 背 板 的 多 个 网 段 之 间 进 行 分 
配 、 平 衡 )、 帧 交换 〈 处 理 方式 : 直通 交换 一 一 提供 线 速 处 理 能 力 ， 交 换 机 只 读 出 网 络 帧 的 前 
14 个 字 节 , 便 将 网 络 帧 传送 到 相应 的 端口 上 ; 存储 转发 一 一 通过 对 网 络 帧 的 读 取 进 行 验 错 和 控 
制 ; 碎片 丢弃 一 一 检查 数据 包 的 长 度 是 否 够 64 个 字 节 ， 如 果 小 于 64 字 节 ， 说 明 是 假 包 ， 丢 弃 
该 包 ， 否 则 发 送 该 包 ) 和 信 元 交换 (采用 长 度 固定 的 信 元 交换 )。 


4. 网络 层 互 连 设备 


路 由 器 (Router) 是 网 络 层 互 连 设备 ， 用 于 连接 多 个 逻辑 上 分 开 的 网 络 。 风 辑 网 络 是 指 一 
个 单独 的 网 络 或 一 个 子 网 ， 当 数据 从 一 个 子 网 传输 到 另 一 个 子 网 时 ， 可 通过 路 由 器 来 完成 。 

路 由 器 具有 很 强 的 异种 网 互 连 能 力 ， 互 连 网 络 的 最 低 两 层 协议 可 以 互 不 相同 ， 通 过 驱动 软 
件 接口 到 第 三 层 而 得 到 统一 。 对 于 互连网 络 的 第 三 层 协议 ， 如 果 相 同 ， 可 使 用 单 协议 路 由 器 进 
行 互 连 ， 如 果 不 同 ， 则 应 使 用 多 协议 路 由 器 。 多 协议 路 由 器 同时 支持 多 种 不 同 的 网 络 层 协议 ， 
并 可 以 设置 为 允许 或 禁止 某 些 特定 的 协议 。 所 谓 支持 多 种 协议 ， 是 指 支持 多 种 协议 的 路 由 ， 而 
不 是 指 不 同类 协议 的 相互 转换 。 

通常 把 网 络 层 地 址 信息 称 为 网 络 逻辑 地 址 ， 把 数据 链 路 层 地 址 信息 称 为 物理 地 址 。 路 由 器 
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最 主要 的 功能 是 选择 路 径 。 在 路 由 器 的 存储 器 中 维护 着 一 个 路 径 表 , 记录 各 个 网 络 的 逻辑 地 址 ， 
用 于 识别 其 他 网 络 。 在 互连网 络 中 ， 当 路 由 器 收 到 从 一 个 网 络 向 另 一 个 网 络 发 送 的 信息 包 时 ， 
将 丢弃 信息 包 的 外 层 ， 解 读 信息 包 中 的 数据 ， 获 得 目的 网 络 的 逻辑 地 址 ， 使 用 复杂 的 程序 来 决 
定 信息 经 由 哪 条 路 径 发 送 最 合适 ， 然 后 重新 打包 并 转发 出 去 。 路 由 器 的 功能 还 包括 过 滤 、 存 储 
转发 、 流 量 管理 和 介质 转换 等 。 一 些 增强 功能 的 路 由 器 还 可 有 加 密 、 数 据 压缩 、 优 先 和 容错 管 
理 等 功能 。 由 于 路 由 器 工作 于 网 络 层 ， 它 处 理 的 信息 量 比 网 桥 要 多 ， 因 而 处 理 速度 比 网 桥 慢 。 


5. 应 用 层 互 连 设备 


网 关 〈Gateway) 是 应 用 层 的 互 连 设备 。 在 一 个 计算 机 网 络 中 ， 当 连接 不 同类 型 且 协 议 差 
别 较 大 的 网 络 时 ， 则 要 选用 网 关 设 备 。 网 关 的 功能 体现 在 OSI 模型 的 最 高 层 ， 它 将 协议 进行 转 
换 ， 将 数据 重新 分 组 ， 以 便 在 两 个 不 同类 型 的 网 络 系统 之 间 进 行 通信 。 由 于 协议 转换 是 一 件 复 
杂 的 事 ， 一 般 来 说 ， 网 关 只 进行 一 对 一 转换 ， 或 是 少数 几 种 特定 应 用 协议 的 转换 ， 网 关 很 难 实 
现 通用 的 协议 转换 。 


10.2.2 网络 的 传输 介质 


传输 介质 是 信号 传输 的 媒体 ， 常 用 的 介质 分 为 有 线 介 质 和 无 线 介 质 。 有 线 介 质 有 双 绞 线 、 
同 轴 电 缆 和 光纤 等 ， 无 线 介 质 有 微波 、 红 外 线 和 卫星 通信 等 。 


1， 有 线 介质 


1) 双 绞 线 (Twisted-Pair) 

双 绞 线 是 现在 最 普通 的 传输 介质 ， 它 分 为 屏蔽 双 绞 线 CSTP) 和 非 屏蔽 双 绞 线 (UTP)。 非 
屏蔽 双 绞 线 有 线 缆 外 皮 作 为 屏蔽 层 ， 适 用 于 网 络 流量 不 大 的 场合 中 。 屏 蔽 式 双 绞 线 具有 一 个 金 
属 甲 套 ， 对 电磁 干扰 具有 较 强 的 抵抗 能 力 ， 适 用 于 网 络 流量 较 大 的 高 速 网 络 协议 应 用 。 双 绞 线 
又 可 分 为 3 类 .4 类 和 5 类 、6 类 和 7 类 双 绞 线 , 现 在 常用 的 是 5 类 UTP, 其 频率 带宽 为 100MHz。 
6 类 、7 类 双 绞 线 分 别 可 工作 于 200MHz 和 600MHz 的 频率 带宽 之 上 ， 且 采用 特殊 设计 的 RJ45 

双 绞 线 最 多 应 用 于 10Base-T 和 100Base-T 的 以 太 网 中 ， 具 体 规定 有 : 一 段 双 绞 线 的 最 大 长 
度 为 100m， 只 能 连接 一 台 计算 机 ; 双 绞 线 的 每 端 需要 一 个 RJ45 插件 ， 各 段 双 绞 线 通 过 集线器 
互 连 ， 利 用 双 绞 线 最 多 可 连接 64 个 站 点 到 中 继 器 。 

2) 同 轴 电线 (Coaxial) 

同 轴 电 缆 也 像 双 绞 线 那样 由 一 对 导体 组 成 。 同 轴 电 线 又 分 为 基带 同 轴 电 绕 〔 阻 抗 为 50Q) 
和 宽带 同 轴 电 线 (阻抗 为 75Q)。 基 带 同 轴 电 缆 用 来 直接 传输 数字 信号 ， 它 又 分 为 粗 同 轴 电 缆 和 
细 同 轴 电 线 ， 其 中 ， 粗 同 轴 电 缆 适用 于 较 大 局 域 网 的 网 络 干线 ， 布 线 距 离 较 长 ， 可 靠 性 较 好 ， 
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但 是 网 络 安装 、 维 护 等 方面 比较 困难 ， 造 价 较 高 ; 细 同 轴 电 缆 安 装 较 容 易 ， 而 且 造 价 较 低 ， 但 
因 受 网 络 布线 结构 的 限制 ， 其 日 常 维护 不 甚 方便 。 宽 带 同 轴 电 缆 用 于 频 分 多 路 复 用 (FDMD) 的 
模拟 信号 发 送 ， 还 用 于 不 使 用 频 分 多 路 复 用 的 高 速 数字 信号 发 送 和 模拟 信号 发 送 。 闭 路 电视 所 
使 用 的 CATV 电缆 就 是 宽带 同 轴 电 缆 。 

3) 光纤 (Fiber Optic) 

光 导 纤维 简称 光纤 ， 它 重量 轻 、 体 积 小 。 用 光纤 传输 电信 号 时 ， 在 发 送 端 要 先 将 其 转换 成 
光 信 号 ， 而 在 接收 端 又 要 由 光 检 波 器 还 原 成 电信 和 号。 光纤 是 软 而 细 的 、 利 用 内 部 全 反射 原理 来 
传导 光束 的 传输 介质 。 按 光源 采用 不 同 的 发 光 管 分 为 发 光 二 极 管 和 注入 型 激光 二 极 管 。 多 模 光 
纤 (Multimode Fiber) 使 用 的 材料 是 发 光 二 极 管 , 价格 较 便 宜 , 但 定向 性 较 差 ; 单 模 光纤 (Single 
Mode Fiber) 使 用 的 材料 是 注入 型 二 极 管 ， 定 向 性 好 、 损 耗 少 、 效 率 高 、 传 播 距 离 长 ， 但 价格 


昂贵 。 
2， 无线 介质 


无 线 传输 介质 都 不 需要 架设 或 铺 埋 电 缆 或 光纤 ， 而 是 通过 大 气 传 输 ， 目 前 有 3 种 技术 : 微 
波 、 红 外 线 和 激光 、 卫 星 。 

1) 微波 

微波 通信 是 在 对 流 层 视线 距离 范围 内 利用 无 线 电波 进行 传输 的 一 种 通信 方式 ， 频 率 范 围 为 
2 一 40GHz。 微 波 通信 是 沿 直线 传播 的 ， 由 于 地 球 表面 是 曲面 的 ， 微 波 在 地 面 的 传播 距离 有 限 ， 
直接 传播 的 距离 与 天 线 的 高 度 有 关 ， 天 线 越 高 距离 越 远 ， 但 超过 一 定 距离 后 就 要 用 中 继 站 来 接 
力 ， 两 微波 站 的 通信 距离 一 般 为 30 一 S0km。 长 途 通 信 时 必须 建立 多 个 中 继 站 ， 中 继 站 的 功能 
是 变频 和 放大 ， 进 行 功率 补偿 。 微 波 通信 分 为 模拟 微波 通信 和 数字 微波 通信 两 种 。 模 拟 微波 通 
信 主 要 采用 调频 制 ， 数 字 微 波 通信 大 多 采用 相 移 键 控 (PSK)。 微 波 通信 的 传输 质量 比较 稳定 ， 
影响 质量 的 主要 因素 是 雨 雪 天 气 对 微波 产生 的 吸收 损耗 ， 不 利 地 形 或 环境 对 微波 所 造成 的 衰减 
现象 。 

2) 红外 线 和 激光 

红外 通信 和 激光 通信 也 像 微 波 通信 一 样 ， 有 很 强 的 方向 性 ， 都 是 沿 直线 传播 的 。 这 3 种 技 
术 都 需要 在 发 送 方 和 接收 方 之 间 有 一 条 视线 (Line-of-sight) 通路 , 有 时 统称 这 三 者 为 视线 媒体 。 
所 不 同 的 是 ， 红 外 通信 和 激光 通信 把 要 传输 的 信号 分 别 转换 为 红外 光 信 号 和 激光 信号 ， 直 接 在 
空间 传播 。 由 于 这 3 种 视线 媒体 都 不 需要 铺设 电缆 ， 对 于 不 论 是 在 地 下 或 用 电线 杆 很 难 在 建筑 
物 之 间架 设 电缆 ， 特 别 是 要 穿越 的 空间 属于 公共 场所 的 局 域 网 特别 有 用 。 但 这 3 种 技术 对 环境 
气候 较为 敏感 ， 例 如 雨 、 雾 和 和 雷电。 相对 来 说 ， 微 波 一 般 对 雨 和 和 雾 的 敏感 度 较 低 。 

3) 卫星 

卫星 通信 是 以 人 造 卫 星 为 微波 中 继 站 ， 它 是 微波 通信 的 特殊 形式 。 卫 星 接收 来 自 地 面 发 送 
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站 发 出 的 电磁 波 信号 后 ， 再 以 广播 方式 用 不 同 的 频率 发 回 地 面 ， 被 地 面 工作 站 接收 。 卫 星 通信 
可 以 克服 地 面 微波 通信 距离 的 限制 。 一 个 同步 卫星 可 以 覆盖 地 球 的 1/3 以 上 表面 ，3 个 这 样 的 
卫星 就 可 以 覆盖 地 球 上 的 全 部 通信 区 域 ， 这 样 地 球 上 的 各 个 地 面 站 之 间 都 可 互相 通信 了 。 由 于 
卫星 信道 频带 宽 ， 也 可 采用 频 分 多 路 复 用 技术 分 为 若干 个 子 信道 ， 有 些 用 于 由 地 面 站 向 卫星 发 
送 ( 称 为 上 行 信道 )， 有 些 用 于 由 卫星 向 地 面 转发 ( 称 为 下 行 信道 )。 卫 星 通信 的 优点 是 容量 大 、 
距离 远 ， 缺 点 是 传播 延迟 时 间 长 。 

10.2.3 组 建 网 络 


在 一 个 局 域 网 中 ,其 基本 组 成 部 件 为 服务 器 、 客 户 端 、 网 络 设备 、 通 信介 质 和 网 络 软件 等 。 

(1) 服务 器 (Server)。 局 域 网 的 核心 ， 根 据 它 在 网 络 中 的 作用 ， 还 可 进一步 分 为 文件 服务 
器 、 打 印 服务 器 和 通信 服务 器 等 。 

(2) 客户 端 (Client)。 客 户 端 又 称 为 用 户 工作 站 ， 包 括 用 户 计算 机 与 网 络 应 用 接口 设备 。 

(3) 网 络 设备 。 网 络 设备 主要 指 一 些 硬件 设备 ， 如 网 卡 、 收 发 器 、 中 继 器 、 集 线 器 、 网 桥 
和 路 由 器 等 。 网 卡 是 一 种 必 不 可 少 的 网 络 设备 , 常用 的 网 卡 有 Ethemet (以 太 网 ) 网 卡 、 ARCNET 
网 卡 、ESIA 总 线 网 网 卡 和 Token-Ring 网 卡 等 。 

(4) 通信 介质 。 数 据 的 传输 媒体 ， 不 同 的 通信 介质 有 着 不 同 的 传输 特性 。 

(5) 网 络 软件 。 网 络 软件 主要 包括 底层 协议 软件 、 网 络 操作 系统 (NOS) 等 。 底 层 协 议 软 
件 由 一 组 标准 规则 及 软件 构成 ， 以 使 实体 间或 网 络 之 间 能 够 互相 进行 通信 。 网 络 操作 系统 主要 
对 整个 网 络 的 资源 和 运行 进行 管理 ， 并 为 用 户 提供 应 用 接口 。 

【 例 10.1】 为 了 将 两 个 相 邻 办 公 室 的 多 台 计 算 机 连接 成 一 个 局 域 网 ， 以 方便 传输 文件 、 共 
享 资源 ， 最 简单 的 连接 方式 如 图 10-5 所 示 。 


MAX: 100mUTP 
MAX: 100mUTP 


J Hub/Switch | 


/I\ 


服务 器 客户 并 | 客站 客户 端 | | 服务 器 | | 客户 端 


图 10-5 简单 网 络 连接 方式 


可 以 采用 集线器 将 两 个 办 公 室 的 多 台 计 算 机 连接 成 一 个 局 域 网 ， 如果 感觉 速度 较 慢 ， 可 将 
Hub 换 成 交换 机 (Switch)， 构 成 树 型 或 总 线 和 星 型 结合 的 拓扑 结构 ; 传输 介质 采用 五 类 以 上 的 
非 屏蔽 双 绞 线 ， 使 用 RJ45 连接 Hub 与 计算 机 ; 网 卡 采 用 10/100M 自 适应 的 以 太 网 卡 ; 协议 使 
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用 TCPIP、NETBIEU 或 其 他 协议 。 该 网 络 安装 和 维护 简单 易 行 ， 且 费用 低廉 ， 计 算 机 和 Hub 
之 间 的 最 大 UTP 电缆 长 度 为 100m， 两 个 计算 机 之 间 〈 即 端 一 端 ) 最 多 允许 有 4 个 Hub 和 5 个 
电缆 段 ， 即 最 大 网 络 长 度 为 500m。 

【 例 10.2】 某 学 校 建设 高 速 信息 网 络 ， 网 络 主干 中 心 为 千 兆 以 太 网 的 光纤 局 域 网 ， 连 接 各 
学 院 、 系 、 图 书馆 等 信息 网 ， 并 接 入 Internet， 以 便 实 现 各 级 各 类 网 络 的 互 连 互通 ， 为 学 校 的 各 
级 单位 、 教 师 、 学 生 提 供 方便 、 快 捷 的 信息 与 教学 服务 ， 从 而 有 效 地 为 科研 、 教 学 服务 ， 提 高 
学 校 的 整体 水 平 。 网 络 的 构建 如 图 10-6 所 示 。 
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图 10-6 校园 网 的 构建 


【 例 10.3】 某 家 庭 想 连 接 Internet， 决 定 申请 一 条 ADSL 线路 ， 通 过 拨号 来 连接 Internet， 
原因 如 下 。 

(1) ADSL 具有 很 高 的 传输 速率 ， 其 下 行为 2 一 8Mbps， 上 行为 64 一 640Kbps， 为 普通 拨号 
Modem 的 百倍 以 上 ， 也 是 宽带 上 网 中 速度 较 高 的 一 种 。 

(2) ADSL 上 网 和 打 电话 互 不 干扰 ，ADSL 数据 信号 和 电话 音频 信号 以 频 分 复 用 原理 调制 ， 
各 自 频 段 互 不 干扰 ， 在 上 网 的 同时 可 以 使 用 电话 ， 避 免 了 拨号 上 网 的 烦恼 。 

(3) ADSL 独 享 带宽 、 安 全 可 靠 ， 其 他 宽带 方式 虽然 在 速度 方面 有 超过 它 的 ， 但 有 的 是 属 
于 共享 带宽 方式 。 例 如 Cable Modem 下 行 可 达到 20Mbps， 但 它 是 一 种 粗糙 的 总 线 型 广播 网 络 ， 
成 千 上 万 用 户 争 抢 20Mbps 的 带宽 ， 而 非 独 享 ， 更 为 严重 的 是 ， 它 属于 总 线 型 的 网 络 ， 先 天 的 
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广播 特性 造成 了 信息 传输 的 不 安全 性 。ADSL 利用 中 国电 信 深 入 千家 万 户 的 电话 网 络 ， 先 天 形 
成 星 型 结构 的 网 络 拓扑 构造 ， 骨 干 网 络 采 用 遍布 全 城 、 全 国 的 光纤 传输 ， 独 享 2 一 8Mbps 带宽 ， 
信息 传递 快速 、 可 靠 安全 。 

(4) ADSL 费用 低廉 ， 虽 然 电话 线 同 时 传递 电话 语音 和 数据 ， 但 数据 并 不 通过 电话 交换 机 ， 
因此 不 用 拨号 ， 一 直 在 线 ， 属 于 专线 上 网 方式 。 这 意味 着 使 用 ADSL 上 网 不 需要 缴纳 拨号 上 网 
的 电话 费用 。 另 一 方面 ,不 需要 对 原 有 电话 线路 进行 改造 , 用户 端 不 需要 购买 价格 昂贵 的 设备 ， 
只 需 一 个 现在 相当 普及 的 ADSL Modem 即 可 ， 相 对 来 说 投资 较 少 。 

(5) ADSL 能 提供 真正 的 视频 点 播 (VOD)、 网 上 游戏 、 交 互 电视 和 网 上 购物 等 宽带 多 媒 
体 服务 ， 远 程 LAN 接 入 、 远 地 办 公 室 、 在 家 工作 等 高 速 数 据 应 用 ， 远 程 医疗 、 远 程 教学 、 远 
地 可 视 会 议 、 体 育 比 赛 现场 实时 传送 等 。 

ADSL 连接 Intemet 的 方式 有 两 种 : 专线 接 入 和 虚拟 拨号 接 入 。 采 用 虚拟 拨号 方式 的 用 户 
采用 类 似 Modem 和 ISDN 的 拨号 程序 , 在 使 用 习惯 上 与 原来 的 方式 没什么 不 同 。 采 用 专线 接 入 
的 用 户 只 要 开机 即 可 接 入 Intemet。 

使 用 ADSL 上 网 所 需 的 设备 包括 一 块 网 卡 和 ADSL Modem。 当 然 ， 家 用 计算 机 是 必需 的 。 
连接 方式 如 图 10-7 所 示 。 


连接 电话 公司 外 线 


ADSL Modem 


电话 机 


图 10-7 ADSL 单 用 户 接 入 方式 


如 果 不 是 家 庭 ， 而 是 公司 或 企业 ， 则 局 域 网 通过 ADSL 接 入 Intemet， 其 接 入 方法 有 如 下 
两 种 。 

(1) 将 直接 通过 ADSL 连 上 网 的 那 台 主机 设置 成 代理 服务 器 ， 然 后 本 地 局 域 网 上 的 客户 端 
通过 该 代理 服务 器 访问 外 部 信息 资源 。 这 种 方法 的 好 处 是 需要 申请 一 个 账号 或 一 个 瑟 地 址 , 本 
地 客户 端 可 采用 保留 卫 地址 。 

(2) 采用 专线 方式 ， 为 局 域 网 上 的 每 台 计算 机 向 电话 局 申请 一 个 人 P 地 址 。 这 种 方法 的 好 
处 是 无 须 设 置 一 台 专用 的 代理 服务 网 关 ， 缺 陷 是 目前 对 一 条 ADSL 线路 只 能 提供 最 多 8 个 中 
地 址 给 局 域 网 。 

通过 代理 服务 器 将 公司 或 企业 接 入 Intemet 的 方式 如 图 10-8 所 示 。 
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图 10-8 ”公司 或 企业 的 ADSL 接 入 方式 


在 连接 时 需要 注意 的 问题 如 下 。 

(1) 接口 方式 。 有 以 太 网 、USB 和 了 CI 3 种 。USB、PCI 适用 于 家 庭 用 户 ， 性 价 比 好 ， 小 
巧 、 方便 、 实 用 ;外 置 以 太 网 口 的 产品 只 适用 于 企业 和 办 公 室 的 局 域 网 ， 它 可 以 带 多 台 机 器 进 
行 上 网 。 有 的 以 太 网 接口 的 ADSL Modem 同时 具有 桥接 和 路 由 功能 。 

(2) 分 离 器 。 使 上 网 和 打 电 话 互 不 干扰 。 

(3) 支持 的 协议 。ADSL Modem 上 网 拨号 方式 有 3 种 ， 即 专线 方式 (静态 一 )、PPPoA 和 
PPPoE。 普 通用 户 多 采用 PPPoE (Point-to-Point Protocol over Ethermet) 或 PPPoA (Point-to-Point 
Protocol over ATM) 虚拟 拨号 的 方式 上 网 。 


10.3 网络 的 协议 与 标准 


计算 机 网 络 的 硬件 设备 是 承载 计算 机 通信 的 实体 , 但 它们 是 怎样 有 序 地 完成 计算 机 之 间 通 
信任 务 的 呢 ? 也 就 是 说 ， 要 共享 计算 机 网 络 的 资源 以 及 进行 网 络 中 的 交换 信息 ， 需 要 实现 不 同 
系统 中 实体 的 通信 。 两 个 实体 要 想 成 功 地 通信 ， 它 们 必须 具有 相同 的 语言 ， 在 计算 机 网 络 中 称 
为 协议 〈 或 规程 )。 所 谓 协 议 ， 指 的 是 网 络 中 的 计算 机 与 计算 机 进行 通信 时 ， 为 了 能 够 实现 数 
据 的 正常 发 送 与 接收 必须 要 遵循 的 一 些 事先 约定 好 的 规则 标准 或 约定 )， 在 这 些 规程 中 明确 
规定 了 通信 时 的 数据 格式 、 数 据 传送 时 序 以 及 相应 的 控制 信息 和 应 答 信号 等 内 容 。 下 面 主要 介 
绍 网 络 的 标准 、 局 域 网 协议 与 广域网 协议 。 


10.3.1 网 络 的 标准 


在 网 络 的 标准 化 方面 ， 有 许多 标准 化 机 构 在 工作 ， 例 如 国际 标准 化 组 织 、 国 际 电 信 联 盟 、 
电子 工业 协会 、 电 气 和 电子 工程 师 协会 、 因 特 网 活动 委员 会 等 。 
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电信 标准 


1865 年 成 立国 际 电信 联盟 (International Telecommunication Union, ITU), 1947 年 ITU 成 
为 联合 国 的 一 个 组 织 ， 它 由 以 下 3 部 分 组 成 。 


ITU-R: 无 线 通信 部 门 。ITU-R 的 主要 工作 是 确保 无 线 电 频率 和 卫星 轨道 被 所 有 国家 
平等 有效 和 经 济 地 利用 , 召开 世界 性 和 地 区 性 大 会 来 制定 无 线 电 法 规 和 地 区 性 协议 ， 
起 草 并 通过 有 关 技 术 、 业 务 和 系统 的 建议 。 

ITU-T: 电信 标准 部 门 。 下 设 许多 研究 组 ， 研 究 组 下 设 专题 ， 从 事 网 络 管理 、 网 络 维 
护 、 业 务 运营 、 网 络 和 终端 的 端 对 端 传输 特性 、 网 络 总 体 方面 、 多 媒体 业务 和 系统 等 
方面 的 研究 。 例 如 ，Q42/SG VII 专门 研究 OSI 参考 模型 。 

ITU-D: 开发 部 门 。 主 要 宗旨 是 促进 第 三 世界 国家 的 电信 发 展 。 


1953 年 到 1993 年 , ITU-T 被 称 为 CCITT (国际 电报 电话 咨询 委员 会 )。 CCITT 建议 自 1993 
年 起 都 打上 了 ITU-T 标记 。 已 经 公布 并 使 用 的 重要 的 标准 如 下 。 

(1) V 系列 。ITU-T 提出 的 V 系列 标准 主要 是 针对 调制 解 调 器 的 标准 。 例 如 ，V90 是 
56Kbps 调制 解 调 器 的 标准 。 

(2) X 系列。ITU-T 提出 的 义 系列 标准 是 应 用 于 广域网 的 ， 该 系列 标准 分 为 以 下 两 组 。 


X.1 一 X.39 标准 。 应 用 于 终端 形式 、 接 口 、 服 务 设施 和 设备 。 最 著名 的 标准 是 X.25， 
它 规定 了 数据 包装 和 传送 的 协议 。 
X.40 一 X.199 标准 。 管 理 网 络 结构 、 传 输 、 发 信号 等 。 


2. 国际 标准 


1946 年 成 立 的 国际 标准 化 组 织 负责 制定 各 种 国际 标准 ，ISO 有 89 个 成 员 国 家 ，85 个 其 他 
成 员 。ISO 的 任务 是 促进 全 球 范围 内 的 标准 化 及 其 有 关 活 动 ， 以 利于 国际 间 产 品 与 服务 的 交流 ， 
以 及 在 知识 、 科 学 、 技 术 和 经 济 活动 中 发 展 国 际 间 的 相互 合作 。 例 如 ，ISO 开发 了 开放 式 系统 
互连网 络 结构 模型 ， 该 模型 定义 了 用 于 网 络 结构 的 7 个 数据 处 理 层 。 

其 他 标准 化 组 织 如 下 。 


ANSI: 美国 国家 标准 研究 所 ，ISO 的 美国 代表 。ANSI 设计 了 ASCII 代码 组 ， 它 是 一 
种 广泛 使 用 的 数据 交换 标准 代码 。 

NIST: 美国 国家 标准 和 技术 研究 所 ， 美 国 商业 部 的 标准 化 机 构 。 

IEEE: 电气 和 电子 工程 师 协 会 (Institute of Electrical and Electronics Engineers)。IEEE 
设置 了 电子 工业 标准 , 分 成 一 些 标准 委员 会 (或 工作 组 ), 每 个 工作 组 负责 标准 的 一 个 
领域 , 工作 组 802 设置 了 网 络 上 的 设备 如 何 彼此 通信 的 标准 , 即 IEEE 802 标准 委员 会 
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划分 成 的 工作 组 有 802.1 工作 组 ， 协 调 低档 与 高 档 OSI 模型 ，802.2 工作 组 ,涉及 逻辑 
数据 链 路 标准 ;802.3 工作 组 ， 有 关 CSMA/CD 标准 在 以 太 网 的 应 用 ;802.4 工作 组 ， 
令 牌 总 线 标准 在 LAN 中 的 应 用 ;802.5 工作 组 ， 设 置 有 关 令 牌 环 网 络 的 标准 。 

。 EIA: 电子 工业 协会 (Electronic Industries Association)。 最 为 人 熟悉 的 EIA 标准 之 一 
是 RS-232C 接口 ， 这 一 通信 接口 允许 数据 在 设备 之 间 交 换 。 

值得 注意 的 是 ，ITU-T 和 ISO 之 间 有 很 好 的 合作 和 协调 。 

3. Internet 标准 


Internet 标准 的 特点 是 自发 而 非 政府 干预 的 ， 管 理 松散 ， 每 个 分 网 络 均 由 各 自分 别管 理 ， 目 前 
已 组 成 了 一 个 民间 性 质 的 协会 ISOC (Internet Society) 进行 必要 的 协调 与 管理 ， 有 一 个 网 络 信 
息 中 心 (NIC) 来 管理 下 地 址 ， 保 证 注册 地 址 的 唯一 性 ， 并 为 用 户 提供 一 些 文件 ， 介 绍 可 用 的 
服务 。ISOC 设 有 Intemet 总 体 管理 机 构 结构 (IAB)。 

1969 年 ， 在 ARPANET 时 代 就 开始 发 布 请 求 评注 (Request For Comments，RFC)， 至 今 已 
超过 3000 个 。 


10.3.2 局域网 协议 


IEEE 局 域 网 标准 委员 会 对 局 域 网 的 定义 为 :“ 局 域 网络 中 的 通信 被 限制 在 中 等 规模 的 地 理 
范围 内 ， 如 一 所 学 校 ， 能 够 使 用 具有 中 等 或 较 高 数据 速率 的 物理 信道 ， 且 具有 较 低 的 误 码 率 ; 
局 域 网 络 是 专用 的 ， 由 单一 组 织 机 构 所 使 用 。” 局 域 网 技术 由 于 具有 规模 小 、 组 网 灵活 和 结构 
规整 的 特点 ， 极 易 形 成 标准 。 事 实 上 ， 局 域 网 技术 也 是 在 所 有 计算 机 网 络 技术 中 标准 化 程度 最 
高 的 一 部 分 。 国 际 电子 电气 工程 师 协 议 早 在 20 世 纪 70 年 代 就 制定 了 3 个 局 域 网 标准 :IEEE 802.3 
(CSMA/CD， 以 太 网 )、IEEE 802.4 (Token Bus， 令 牌 总 线 ) 和 IEEE 802.5 (Token Ring， 令 牌 
环 )。 由 于 它 已 被 市 场 广泛 接受 ， 因 此 IEEE 802 系列 标准 已 被 ISO 采纳 为 国际 标准 。 而 且 ， 随 
着 网 络 技术 的 发 展 ， 又 出 现 了 IEEE 802.7 (FDDI)、IEEE 802.3u (快速 以 太 网 )、IEEE 802.12 
(100VG-AnyLAN) 和 IEEE 802.3z 〈 千 兆 以 太 网 ) 等 新 一 代 网 络 标准 。 

一 个 局 域 网 的 基本 组 成 主要 有 网 络 服务 器 、 网 络 工作 站 、 网 络 适 配器 和 传输 介质 。 这 些 设 
备 在 特定 网 络 软件 支持 下 完成 特定 的 网 络 功能 。 决 定局 域 网 特性 的 主要 技术 有 3 个 方面 : 用 于 
传输 数据 的 传输 介质 ; 用 于 连接 各 种 设备 的 拓扑 结构 ; 用 于 共享 资源 的 介质 访问 控制 方法 。 它 
们 在 很 大 程度 上 决定 了 传输 数据 的 类 型 、 网 络 的 响应 时 间 、 香 吐 量 和 利用 率 ， 以 及 网 络 应 用 等 
各 种 网 络 特性 。 不 同 的 局 域 网 协议 最 重要 的 区 别 是 介质 访问 控制 方法 ， 它 对 网 络 特性 具有 十 分 
重要 的 影响 。 
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1. LAN 模型 


ISO/OSI 的 7 层 参 考 模型 本 身 不 是 一 个 标准 , 在 制定 具体 网 络 协议 和 标准 时 , 要 以 OSVRM 
参考 模型 作为 “参照 基准 ”， 并 说 明 与 该 “参照 基准 ”的 对 应 关系 。 在 IEEE 802 局 域 网 (LAN) 
标准 中 只 定义 了 物理 层 和 数据 链 路 层 两 层 ， 并 根据 LAN 的 特点 把 数据 链 路 层 分 成 逻辑 链 路 控 
制 (Logical Link Control，LLC) 子 层 和 介质 访问 控制 (Medium Access Control，MAC) 子 层 ， 
还 加 强 了 数据 链 路 层 的 功能 ， 把 网 络 层 中 的 寻 址 、 排 序 、 流 控 和 差错 控制 等 功能 放 在 LLC 子 层 
来 实现 。 图 10-9 为 LAN 协议 的 层次 以 及 与 OSIRM 参考 模型 的 对 应 关系 。 


OSIRM 


逻辑 链 路 控制 层 
一 | 介质 访问 控制 导 
| 


图 10-9 LAN 层次 与 OSURM 的 对 应 关系 


1) 物理 层 

和 OSI 物理 层 的 功能 一 样 ， 主 要 处 理 在 物理 链 路 上 发 送 、 传 递 和 接收 非 结构 化 的 比特 流 ， 
包括 对 带宽 的 频道 分 配 和 对 基带 的 信号 调制 、 建 立 、 维 持 、 撤 销 物 理 链 路 ， 处 理 机 械 的 、 电 气 
的 和 过 程 的 特性 。 其 特点 是 可 以 采用 一 些 特殊 的 通信 媒体 ， 在 信息 组 成 的 格式 上 可 以 有 多 种 。 

2) MAC 
主要 功能 是 控制 对 传输 介质 的 访问 ，MAC 与 网 络 的 具体 拓扑 方式 以 及 传输 介质 的 类 型 有 关 ， 
主要 是 介质 的 访问 控制 和 对 信道 资源 的 分 配 。MAC 层 还 实现 帧 的 寻 址 和 识别 ， 完 成 帧 检测 序列 产 
生 和 检验 等 功能 。 

3) 重光 

LLC 可 提供 两 种 控制 类 型 ， 即 面向 连接 服务 和 非 连接 服务 。 其 中 ， 面 向 连接 服务 能 够 提供 
可 靠 的 信道 。 逻 辑 链 路 控制 层 提供 的 主要 功能 是 数据 帧 的 封装 和 拆除 ， 为 高 层 提供 网 络 服务 的 
逻辑 接口 ， 能 够 实现 差错 控制 和 流量 控制 。 

在 计算 机 网 络 体系 结构 中 ， 最 具 代表 性 和 权威 的 是 ISO 的 OSVRM 和 IEEE 的 802 协议 。 
OSI 是 设计 和 实现 网 络 协议 标准 的 最 重要 的 参考 横 型 和 依据 , 而 IEEE 802 制定 了 一 系列 具体 的 
局 域 网 标准 ， 并 不 断 地 增加 新 的 标准 ， 它 们 之 间 的 关系 如 图 10-10 所 示 。 


Ex 
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B02 | 体系 结构 及 网 络 互 连 
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图 10-10 ”IEEE 802 标准 系列 间 的 关系 


2. 以 太 网 (IEEE 802.3 标准 ) 


以 太 网 技术 可 以 说 是 局 域 网 技术 中 历史 最 悠久 和 最 常用 的 一 种 ， 它 采用 的 “ 存 取 方 法 ”是 
带 冲突 检测 的 载波 监听 多 路 访问 协议 (Carrier-Sense Multiple Access with Collision Detection， 
CSMA/CD) 技术 。 

目前 ， 以 太 网 主要 包括 3 种 类 型 ，IEEE 802.3 中 定义 的 标准 局 域 网 ， 速 度 为 10Mbps， 传 
输 介质 为 细 同 轴 电 线 ; IEEE 802.3u 中 定义 的 快速 以 太 网 , 速度 为 100Mbps, 传输 介质 为 双 绞 线 ; 
IEEE 802.3z 中 定义 的 千 兆 以 太 网 ， 速 度 为 1000Mbps， 传 输 介质 为 光纤 或 双 绞 线 。 

1) 介质 访问 技术 

IEEE 802.3 所 使 用 的 介质 访问 协议 CSMA/CD 是 让 整个 网 络 上 的 主机 都 以 竞争 的 方式 来 抢 
夺 传 送 数据 的 权力 。 工 作 过 程 为 : 首先 侦 听 信道 ， 如 果 信道 空 亲 ， 则 发 送 ， 如 果 信 道 忙 ， 则 继 
续 侦 听 , 直到 信道 空闲 时 立即 发 送 。 开 始 发 送 后 再 进行 一 段 时 间 的 检测 ， 方 法 是 边 发 送 边 接收 ， 
并 将 收 、 发 信息 相 比较 ， 若 结果 不 同 ， 表 明 发 送 的 信息 遇 到 碰撞 ， 于 是 立即 停止 发 送 ， 并 向 总 
线 上 发 出 一 串 阻 塞 信 号 ， 通 知 信道 上 各 站 冲突 已 发 生 。 已 发 出 信息 的 各 站 收 到 阻塞 信号 后 ， 等 
待 一 段 随机 时 间 ， 等 待 时 间 最 短 的 站 将 重新 获得 信道 ， 可 重新 发 送 。 

在 CSMA/CD 中 ， 当 检测 到 冲突 并 发 出 阻塞 信号 后 ， 为 了 降低 再 次 冲突 概率 ， 需 要 等 待 一 
个 退 避 时 间 。 退 避 算 法 有 许多 种 ， 常 用 的 一 种 通用 退 避 算法 称 为 二 进 制 指数 退 避 算法 。 

2) IEEE 802.3 一 一 10Mbps 以 太 网 

IEEE 802.3 一 一 10Mbps 以 太 网 定义 过 10Base 5、10Base 2、10Base-T 和 10Base-F 等 儿 种 
(需要 说 明 的 是 ，10Base-T 与 10Base-F 的 最 后 一 项 是 以 线 线 类 型 进行 命名 的 ， 其 中 工 代 表 双 绞 
线 , 代表 光纤 )。10Base 5 标准 是 最 早 的 媒体 规范 ， 它 使 用 阻抗 为 S0Q 的 同 轴 粗 缆 。 但 由 于 同 
轴 粗 缆 的 缆 线 直径 大 ， 所 以 比较 笨重 ， 不 易 铺设 。10Base 2 标准 是 为 了 建立 一 个 比 10Base 5 更 廉 
价 的 局 域 网 ， 它 使 用 阻抗 为 50Q 的 同 轴 细 缆 ， 唯 一 的 差别 就 是 它 使 得 每 两 个 结 点 间 的 距离 限制 
从 500m 降 为 185m。10Base-T 标准 是 一 个 使 用 非 屏蔽 双 绞 线 为 传输 介质 的 标准 , 所 要 用 到 的 非 
屏蔽 双 绞 线 只 需 3 类 线 标 准 即 可 满足 要 求 ， 是 一 个 成 功 的 标准 。10Base-F 标准 充分 利用 了 新 兴 
媒体 光纤 的 距离 长 、 传 输 性 能 好 的 优点 ， 大 大 改进 了 以 太 网 技术 。 
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3) IEEE 802.3u 一 一 100Mbps 快速 以 太 网 

随 着 计算 机 技术 的 不 断 发 展 , 10Mbps 的 网 络 传输 速度 实在 无 法 满足 日 益 增 大 的 需求 .IEEE 
802.3u 充分 考虑 到 了 向 下 兼容 性 ， 它 采用 了 非 屏蔽 双 绞 线 或 屏蔽 双 绞 线 、 光 纤 ) 作为 传输 媒 
介 , 采用 与 IEEE 802.3 一 样 的 介质 访问 控制 层 一 一 CSMA/CD。 IEEE 802.3u 常 称 为 快速 以 太 网 。 
根据 实现 的 介质 不 同 ， 快 速 以 太 网 可 以 分 为 100BaseTX、100BaseFX 和 100BaseT4 三 种 。 

100BaseTX 用 两 对 5 类 非 屏蔽 双 绞 线 〈 或 者 1 类 、2 类 屏蔽 双 绞 线 作 为 传输 媒介 ) 来 实现 
传输 速度 为 100Mbps 的 网 络 ， 最 多 支持 两 个 中 继 器 。100BaseFX 是 两 束 多 模 光 纤 上 的 标准 ， 在 
没有 中 继 设 备 的 网 络 中 最 大 传输 距离 为 400m。100BaseT4 利用 10Mbps 的 网 络 中 使 用 的 3 类 线 
有 两 对 是 空 着 没有 利用 的 特点 ， 使 用 4 对 3 类 非 屏蔽 双 绞 线 上 提供 传输 速度 为 100Mbps 网 络 。 

4) IEEE 802.3z -1000Mbps 千 兆 以 太 网 

IEEE 802.3z 对 介质 访问 控制 层 规范 进行 了 重新 定义 ， 以 维持 适当 的 网 络 传输 距离 ， 介 质 
访问 控制 方法 仍 采 用 CSMA/CD 协议 ， 并 且 重 新 制定 了 物理 层 标准 ， 使 之 能 提供 1000Mbps 的 
原始 带宽 。 因 此 ， 它 仍 是 一 种 共享 介质 的 局 域 网 ， 发 送 到 网 上 的 信号 是 广播 式 的 ， 接 收 站 根据 
地 址 接收 信号 。 网 络 接口 硬件 能 监听 线路 上 是 否 已 存在 信号 ， 以 避免 冲突 ， 或 在 没有 冲突 时 重 
发 数据 。 

在 物理 层 ， 千 兆 以 太 网 支持 以 下 3 种 传输 介质 。 

(1) 光纤 系统 。 支 持 多 模 光 纤 和 单 模 光 纤 系 统 ， 多 模 光 纤 的 工作 距离 为 500m， 单 模 光 纤 
的 工作 距离 为 2000m。 

(2) 宽带 同 轴 电费 系统 。 其 传输 距离 为 25m。 

(3) 5 类 UTP 电缆 。 其 传输 距离 为 100m， 链 路 操作 模式 为 半 双 工 。 

千 光 位 以 太 网 采用 以 交换 机 为 中 心 的 星 型 拓扑 结构 ,主要 用 于 交换 机 与 交换 机 之 间或 者 交 
换 机 与 企业 超级 服务 器 之 间 的 高 速 网 络 连接 。 


3. 令 牌 环 网 (IEEE 802.5) 


令 牌 环 是 环 型 网 中 最 普遍 采用 的 介质 访问 控制 方法 , 它 适用 于 环 型 网 络 结构 的 分 布 式 介质 
访问 控制 ， 其 流行 性 仅 次 于 以 太 网 。 令 牌 环 网 的 传输 介质 虽然 没有 明确 定义 ， 但 主要 基于 屏蔽 
双 绞 线 和 非 屏蔽 双 绞 线 两 种 ， 拓 扑 结 构 可 以 有 多 种 ， 如 环 型 (最 典型 )、 星 型 (采用 得 最 多 ) 
和 总 线 型 (一 种 变形 )。 编 码 方法 为 差分 曼彻斯特 编码 。 

IEEE 802.5 的 介质 访问 使 用 的 是 令 牌 环 控制 技术 ， 工 作 过 程 为 : 首先 ， 令 牌 环 网 在 网 络 中 
传递 一 个 很 小 的 帧 ， 称 为 “ 令 牌 >”， 只 有 拥有 令 牌 环 的 工作 站 才 有 权力 发 送信 息 ; 令 牌 在 网 络 
上 依次 顺序 传递 ， 当 工作 站 要 发 送 数据 时 等 待 捕获 一 个 空 令 牌 ， 将 要 发 送 的 信息 附加 到 后 边 ， 
发 往 下 一 站 ， 如 此 直到 目标 站 ， 然 后 将 令 牌 释放 ; 工作 站 要 发 送 数据 时 ， 如 果 经 过 的 令 牌 不 是 


so 
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空 的 ， 则 等 待 令 牌 释放 。 

当 信 息 帧 绕 环 通过 各 站 时 ， 各 站 都 要 将 帧 的 目的 地 址 与 本 站 地 址 相 比 较 ， 如 果 地 址 符合 ， 
说 明 是 发 送 给 本 站 的 ， 则 将 帧 复制 到 本 站 的 接收 缓冲 器 中 ， 同 时 将 帧 送 回 到 环 上 ， 使 帧 继续 沿 
环 传送 ， 如 果 地 址 不 符合 ， 则 简单 地 将 信息 帧 重新 送 到 环 上 即 可 。 

4. FDDI 


FDDI (Fiber Distributed Data Interface， 光 纤 分 布 式 数据 接口 ) 类似 令 牌 环 网 的 协议 ， 它 用 
光纤 作为 传输 介质 ， 数 据 传输 速度 可 达到 100Mbps， 环 路 长 度 可 扩展 到 200km， 连 接 的 站 点 数 
可 以 达到 1000 个 。 FDDI 采 用 一 种 新 的 编码 技术 ， 称 为 4B/5B 编码 ， 即 每 次 对 4 位 数据 进行 编 
码 。 每 4 位 数据 编码 成 5 位 符号 ， 用 光 信 号 的 存在 或 不 存在 来 代表 5 位 符号 中 的 每 一 位 是 1 还 
是 0。 

光纤 中 传送 的 是 光 信 号 ， 有 光 脉 冲 表示 1， 无 光 脉 冲 表示 0。 这 种 简单 编码 的 缺点 是 没有 
同步 功能 。 在 同 轴 电 缆 或 双 绞 线 作为 传输 介质 的 局 域 风 中， 通常 采 用 曼彻斯特 编码 方式 。 它 利 
用 中 间 的 跳 变 作为 同步 信号 。 这 样 对 每 一 位 数据 单元 产生 两 次 瞬 变 ， 使 带宽 的 利用 率 降 低 。 在 
5 位 编码 的 32 种 组 合 中 ， 实 际 只 使 用 了 24 种 ， 其 中 的 16 种 用 来 做 数据 ， 其 余 8 种 用 来 做 控制 
符号 〈 如 帧 的 起 始 和 结束 符号 等 )。 在 4B/5B 编码 中 ，5 位 码 中 的 “1” 码 至 少 为 两 位 ， 按 NRZI 
编码 原理 ， 信 号 中 就 至 少 有 两 次 跳 变 ， 因 此 接收 端 可 得 到 足够 的 同步 信息 。 

FDDI 采用 双环 体系 结构 ， 两 环 上 的 信息 反方 向 流动 。 双 环 中 的 一 环 称 为 主 环 ， 另 一 环 称 
为 次 环 。 在 正常 情况 下 ， 主 环 传输 数据 ， 次 环 处 于 空闲 状态 。 双 环 设计 的 目的 是 提供 高 可 靠 性 
和 稳定 性 。FDDI 定义 的 传输 介质 有 单 模 光纤 和 多 模 光 纤 两 种 。 


$5. 无 线 局 域 网 (CSMA/CA) 


信息 时 代 的 网 络 已 经 渗透 到 了 个 人 、 企业 以 及 政府 ,现在 的 网 络 建设 已 经 发 展 到 无 所 不 在 ， 
不 论 你 在 任何 时 间 、 任 何 地 点 都 可 以 轻松 上 网 。 网 络 无 所 不 在 其 实 并 不 简单 ， 光 靠 光 纤 、 铜 绕 
是 不 够 的 ， 毕 竞 在 许多 场合 不 允许 铺设 线 绕 。 因 此 ， 需 要 推广 一 种 新 的 解决 方案 ， 使 得 网 络 的 
无 所 不 在 能 够 得 以 实现 ， 这 种 解决 方案 就 是 无 线 数据 网 。 

无 线 局 域 网 使 用 的 是 带 冲突 避免 的 载波 侦 听 多 路 访问 方法 〈CSMA/CA) 。 冲 突 检测 
(Collision Detection〉 变 成 了 冲突 避免 (Collision Avoidance) ， 这 一 字 之 差 是 很 大 的 。 因 为 在 
无 线 传输 中 侦 听 载波 及 冲突 检测 都 是 不 可 靠 的 ， 侦 听 载 波 有 困难 。 另 外 ， 通 常 无 线 电波 经 天 线 
送出 去 时 ， 自 己 是 无 法 监视 到 的 ， 因 此 冲突 检测 实质 上 也 做 不 到 。 在 802.11 中 侦 听 载波 是 由 两 
种 方式 来 实现 的 ， 一 个 是 实际 去 听 是 否 有 电波 在 传 ， 然 后 加 上 优先 权 控 制 ， 另 一 个 是 虚拟 的 侦 
听 载 波 ， 告 知 大 家 待 会 有 多 久 的 时 间 我 们 要 传 东西 ， 以 防止 冲突 。 
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10.3.3 “广域网 协议 


广域网 通常 是 指 履 盖 范 围 大 、 传 输 速率 低 、 以 数据 通信 为 主要 目的 的 数据 通信 网 。 随 着 信 
息 技术 的 迅速 发 展 ， 很 多 国家 的 数据 通信 业务 的 增长 率 已 大 大 提高 ， 特 别 是 国际 互联 网 的 普及 
促进 了 数据 通信 网 技术 的 发 展 。 

在 地 域 分 布 很 远 、 很 分 散 ， 以 至 于 无 法 用 直接 连接 来 接 入 局 域 网 的 场合 ， 广 域 网 C(WAN) 
通过 专用 的 或 交换 式 的 连接 把 计算 机 连接 起 来 。 这 种 广 域 连接 可 以 是 通过 公众 网 建立 的 ， 也 可 
以 通过 服务 于 某 个 专业 部 门 的 专用 网 建立 起 来 。 相 对 来 说 ， 广 域 网 显得 比较 错综复杂 ， 目 前 主 
要 用 于 广 域 传输 的 协议 比较 多 ， 例 如 PPP〈 点 对 点 协议 )、DDN、ISDN (综合 业务 数字 网 )、 
FR 〈 帧 中 继 ) 和 ATM (异步 传输 模式 ) 等 。 


1， 点 对 点 协议 (PPP) 


点 对 点 协议 主要 用 于 “拨号 上 网 ”这 种 广 域 连接 模式 。 它 的 优点 是 简单 、 具 备用 户 验证 能 
力 、 可 以 解决 中 分 配 等 。 它 主要 通过 拨号 或 专线 方式 建立 点 对 点 连接 发 送 数 据 ， 使 其 成 为 各 种 
主机 、 网 桥 和 路 由 器 之 间 简单 连接 的 一 种 通用 的 解决 方案 。 

家 庭 拨号 上 网 就 是 通过 PPP 在 用 户 端 和 运营 商 的 接 入 服务 器 之 间 建 立 通 信和 链 路 。 目 前 ， 宽 
带 接 入 正在 取代 拨号 上 网 ， 在 宽带 接 入 技术 日 新 月 异 的 今天 ，PPP 也 衍生 出 新 的 应 用 。 典 型 的 
应 用 是 在 ADSL (Asymmetrical Digital Subscriber Line, 非 对 称 数据 用 户 线 ) 接 入 方式 当中 , PPP 
与 其 他 的 协议 共同 派生 出 了 符合 宽带 接 入 要 求 的 新 的 协议 ， 例 如 PPPoE 和 PPPoA。 

利用 以 太 网 (Ethernet) 资源 在 以 太 网 上 运行 PPP 来 进行 用 户 认证 接 入 的 方式 称 为 PPPoE。 
PPPoE 既 保护 了 用 户 方 的 以 太 网 资源 ， 又 完成 了 ADSL 的 接 入 要 求 ， 是 目前 ADSL 接 入 方式 中 
应 用 最 广泛 的 技术 标准 。 同 样 ， 在 ATM 网 络 上 运行 PPP 来 管理 用 户 认证 的 方式 称 为 PPPoA。 
它 与 PPPoE 的 原理 相同 ， 作 用 相同 。 不 同 的 是 ， 它 是 在 ATM 网 络 上 ， 而 PPPoE 是 在 以 太 网 网 
络 上 运行 ， 所 以 要 分 别 适应 ATM 标准 和 以 太 网 标准 。 


2. 数字 用 户 线 (xDSL) 


xDSL 是 各 种 数字 用 户 线 的 统称 , 根据 各 种 宽带 通信 业务 需要 , 目前 还 有 DSL 技术 和 产品 ， 
例如 ADSL (Asymmetric DSL， 不 对 称 数字 用 户 线 ) 、SDSL (Single Pair DSL， 单 对 线 数字 用 
户 环 路 ) 、IDSL (ISDN DSL, ISDN 用 的 数字 用 户 线 ) 、RADSL (Rate Adaptive DSL， 速 率 自 
适应 非 对 称 型 数字 用 户 线 ) 和 VDSL (Very High Bit Rate DSL， 甚 高 速 数字 用 户 线 ) 等 。 

ADSL 是 研制 最 早 、 发 展 较 快 的 一 种 。 它 是 在 一 对 铜 双 绞 线 上 为 用 户 提 供 上 、 下 行 非 对 称 
的 传输 速率 〈 即 带宽 ) 。ADSL 接 入 服务 能 做 到 较 高 的 性 能 价格 比 ，ADSL 接 入 技术 较 其 他 接 
入 技术 具有 其 独特 的 技术 优势 : 它 的 速率 可 达到 上 行 1 兆 /下 行 8 兆 ， 速 度 非常 快 。 另 外， 使 用 
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ADSL 上 网 不 需要 占用 电话 线路 ， 在 电话 和 上 网 互 不 干扰 的 同时 大 大 节省 了 普通 上 网 方式 的 话 
费 支出 ， 独 享 带宽 且 安 全 可 靠 ; 安装 快捷 方便 ; 价格 实惠 。 它 把 线路 按 频 段 分 成 语音 、 上 行 和 
下 行 3 个 信道 ， 故 语音 和 数据 可 共用 一 对 线 。ADSL 特别 适合 于 像 VOD 业务 及 Intemet 和 多 媒 
体 业务 的 应 用 。ADSL 一 般 采 用 CAP 和 DMT 两 种 线路 编码 调制 技术 ， 传 输 距 离 与 线 径 、 速 率 
有 关 ， 一 般 在 3km 以 上 。 因 此 ，ADSL 是 一 种 很 有 发 展 前 途 的 数字 接 入 技术 。ADSL 技术 作为 
一 种 宽带 接 入 方式 ， 可 以 为 用 户 提供 中 国电 信 宽 带 网 的 所 有 应 用 业务 。 采 用 各 种 拨号 方式 上 
网 的 用 户 将 逐步 过 渡 到 采用 ADSL 宽带 接 入 方式 ，ADSL 在 宽带 接 入 中 已 经 扮演 着 越 来 越 重要 
的 角色 。 

对 于 个 人 用 户 ， 在 现 有 电话 线 上 安装 ADSL， 只 需 在 用 户 端 安装 一 台 ADSL Modem 和 一 
个 分 离 器 ,用户 线 路 不 用 做 任何 改动 ,极其 方 使 。 数据 线路 为 PC 一 ADSL Modem 一 分 离 器 一 入 
户 接线 盒 一 电话 线 一 DSL 接 入 复 用 器 一 ATM/IP 网 络 ; 语音 线路 为 话机 一 分 离 器 一 入 户 接线 盒 一 
电话 线 一 DSL 接 入 复 用 器 一 交换 机 。 

对 于 企业 用 户 ,在 现 有 电话 线 上 安装 ADSL 和 分 离 器 连接 Hub 或 Switch。 数据 线路 为 PC 一 
以 太 网 (Hub 或 Switch) 一 ADSL 路 由 器 一 分 离 器 一 入 户 接线 盒 一 电话 线 一 DSL 接 入 复 用 器 一 
ATM/IP 网 络 ;语音 线路 为 话机 一 分 离 器 一 入 户 接线 盒 一 电话 线 一 DSL 接 入 复 用 器 一 交换 机 。 


3. 数字 专线 


数字 数据 网 (Digital Data Network，DDN) 是 采用 数字 传输 信道 传输 数据 信号 的 通信 网 ， 
可 提供 点 对 点 、 点 对 多 点 透明 传输 的 数据 专线 出 租 电 路 , 为 用 户 传输 数据 、 图 像 和 声音 等 信息 。 
数字 数据 网 是 以 光纤 为 中 继 干 线 的 网 络 ， 组 成 DDN 的 基本 单位 是 结 点 ， 结 点 间 通 过 光纤 连接 ， 
构成 网 状 的 拓扑 结 

DDN 专线 就 是 市 内 或 长 途 的 数据 电路 ， 电 信 部 门将 它们 出 租 给 用 户 做 资料 传输 使 用 后 ， 它 们 
就 变 成 了 用 户 的 专线 ， 直 接 进 入 电信 的 DDN 网 络 ， 因 为 这 种 电路 是 采用 固定 连接 的 方式 ， 不 
需要 经 过 交换 机 房 ， 所 以 称 之 为 固定 DDN 专线 。DDN 专线 不 仅 需 要 铺设 专用 线路 (在 DDN 
的 客户 端 需要 一 个 称 为 DDN Modem 的 CSU/DSU 设备 以 及 一 个 路 由 器 ) 从 用 户 端 进入 主干 网 
络 , 而 且 需 要 付 电信 月 租 费 、 网 络 使 用 费 和 电路 租用 费 等 。 其 优势 是 网 络 传输 速率 高 、 时 延 小 、 
质量 好 、 网 络 透 明度 高 、 可 支持 任何 规程 、 安 全 可 靠 。 


4. 帧 中 继 


帧 中 继 (Frame Relay，FR) 是 在 用 户 网 络 接口 之 间 提 供用 户 信息 流 的 双向 传送 ， 并 保持 
顺序 不 变 的 一 种 承载 业务 。 用 户 信息 以 帧 为 单位 进行 传输 ， 并 对 用 户 信 息 流 进行 统计 复 用 。 帧 
中 继 是 综合 业务 数字 网 标准 化 过 程 中 产生 的 一 种 重要 技术 ， 它 是 在 数字 光纤 传输 线路 逐渐 代替 
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原 有 的 模拟 线路 、 用 户 终端 智能 化 的 情况 下 由 X25 分 组 交换 技术 发 展 起 来 的 一 种 传输 技术 。 
帧 中 继 是 一 种 基于 可 变 帧 长 的 数据 传输 网 络 , 在 传输 过 程 中 , 网 络 内 部 可 以 采用 “ 帧 交换 ”， 
即 以 帧 为 单位 进行 传送 ， 也 可 采用 “ 信 元 交换 ”， 即 以 信 元 〈33 字 节 长 ) 为 单位 进行 传送 。 
帧 中 继 提 供 一 种 简单 的 面向 连接 的 虚 电 路 分 组 服务 ， 包 括 交换 虚 电 路 连接 和 永久 虚 电 路 连 
接 。 帧 中 继 的 优点 包括 降低 网 络 互 连 费 用 、 简 化 网 络 功能 、 提 高 网 络 性 能 、 采 用 国际 标准 、 各 
厂商 产品 相互 兼容 等 。 


S.， 异步 传输 模式 


异步 传输 模式 “Asynchronous Transfer Mode，ATM) 是 B-ISDN 的 关键 核心 技术 ， 它 是 一 
种 面向 分 组 的 快速 分 组 交换 模式 , 使 用 了 异步 时 分 复 用 技术 , 将 信息 流 分 割 成 固定 长 度 的 信 元 。 
使 用 统一 的 信息 单位 能 比较 容易 地 实现 各 种 信息 流 混合 在 一 起 的 多 媒体 通信 ， 并 能 根据 业务 类 
型 、 速 率 的 需求 动态 地 分 配 有 效 容量 。ATM 能 够 根据 需要 改变 传送 速率 ， 对 高 速 信息 传递 频次 
高 ， 对 低速 信息 传递 频次 低 ， 按 照 统计 复 用 的 原理 进行 传输 和 交换 ， 故 ATM 完全 可 以 用 单一 
的 交换 方式 灵活 、 有 效 地 支持 频带 分 布 范 围 极 广 的 各 种 业务 。 

在 ATM 网 络 中 ， 数 据 以 定 长 的 信 元 为 单位 进行 传输 ， 信 元 由 信 元 头 和 信 元 体 构成 ， 每 个 
信 元 53 个 字 节 ， 其 中 信 元 头 5 个 字 节 ， 信 元 体 48 个 字 节 。 

ATM 的 参考 模型 由 4 层 构 成 ， 分 别 是 用 户 层 、ATM 适 配 层 、ATM 层 和 物理 层 。 图 10-11 
给 出 了 简化 后 的 ATM 的 参考 模型 。 


控制 而 用 户 面 | 
反面 
高 层 协议 高 层 协议 管 1 管 
此 1 理 


ATM 适 配 层 ATM 适 配 层 


ATM 层 


物理 层 


图 10-11 ATM 的 参考 模型 


6. X.25 协议 


X.25 在 本 地 DIE 和 远程 DTE 之 间 提 供 一 个 全 双 工 、 同 步 的 透明 信道 ， 并 定义 了 3 个 相互 
独立 的 控制 层 ， 物理 层 、 数 据 链 路 层 和 分 组 层 ， 它 们 分 别 对 应 于 ISO/OSI 的 物理 层 、 链 路 层 和 
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网 络 层 ， 如 图 10-12 所 示 。 


| 一 


多 重信 道 接口 


数据 链 路 层 | 数据 链 路 接口 | 数据 链 路 层 


物理 层 。 | 物理 层 接 口 。 。_| ”物理 层 


图 10-12 XX.25 层次 模型 


X.25 是 在 公用 数据 网 上 以 分 组 方式 进行 操作 的 DTE 〈 数 据 终 端 设备 ) 和 DCE (数据 通信 
设备 ) 之 间 的 接口 。X.25 只 是 对 公用 分 组 交换 网 络 的 接口 规范 说 明 , 并 不 涉及 网 络 的 内 部 实现 ， 
它 是 面向 连接 的 ， 支 持 交 换 式 虚 电 路 和 永久 虚 电路 。 


10.3.4 TCP/IP 协议 族 


TCP/IP 作为 Internet 的 核心 协议 ， 通 过 近 20 多 年 的 发 展 已 日 渐 成 熟 ， 并 被 广泛 应 用 于 局 
域 网 和 广域网 中 ， 目 前 已 成 为 事实 上 的 国际 标准 。 作 为 一 个 最 早 的 、 也 是 迄今 为 止 发 展 最 为 成 
熟 的 互连网 络 协议 系统 ，TCP/IP 包含 许多 重要 的 基本 特性 ， 这 些 特 性 主要 表现 在 5 个 方面 : 好 
辑 编 址 、 路 由 选择 、 域 名 解析 、 错 误 检测 和 流量 控制 以 及 对 应 用 程序 的 支持 等 。 

(1) 逻辑 编 址 。 每 一 块 网 卡 在 出 三 时 就 由 厂家 分 配 了 一 个 独一无二 的 永久 性 的 物理 地 址 。 
在 Intemet 中 ， 为 每 台 连 入 因特网 的 计算 机 分 配 一 个 逻辑 地 址 ， 这 个 逻辑 地 址 被 称 为 瑟 地 址 。 
一 个 了 P 地 址 可 以 包括 一 个 网 络 ID 号 ， 用 来 标识 网 络 ， 一 个 子 网 络 了 D 号 ， 用 来 标识 网 络 上 的 
一 个 子 网 ， 另 外， 还 有 一 个 主机 ID 号 ， 用 来 标识 子 网 络 上 的 一 台 计 算 机 。 这 样 ， 通 过 这 个 分 
配给 某 台 计算 机 的 下 地址 ， 就 可 以 很 快 地 找到 相应 的 计算 机 。 

(2) 路 由 选择 。 在 TCP/IP 中 包含 了 专门 用 于 定义 路 由 器 如 何 选择 网 络 路 径 的 协议 ， 即 下 
数据 包 的 路 由 选择 。 

(3) 域名 解析 。 虽 然 TCP/IP 采用 的 是 32 位 的 他 地址 ， 但 考虑 到 用 户 记忆 方便 ， 专 门 设 
计 了 一 种 方便 的 字母 式 地 址 结构 ， 称 为 域名 或 DNS (域名 服务 ) 名字。 将 域名 映射 为 瑟 地 址 
的 操作 称 为 域名 解析 。 域 名 具有 较 稳 定 的 特点 ， 而 中 地 址 较 易 发 生变 化 。 

(4) 错误 检测 和 流量 控制 。TCP/IP 具有 分 组 交换 确保 数据 信息 在 网 络 上 可 靠 传递 的 特性 ， 
这 些 特 性 包括 检测 数据 信息 的 传输 错误 保证 到 达 目 的 地 的 数据 信息 没有 发 生变 化 )， 确 认 已 
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传递 的 数据 信息 已 被 成 功 地 接收 ， 监 测 网 络 系统 中 的 信息 流量 ， 防 止 出 现 网 络 拥塞 。 

1. TCP/IP 分 层 模 型 

协议 是 对 数据 在 计算 机 或 设备 之 间 传输 时 的 表示 方法 进行 定义 和 描述 的 标准 。 协 议 规定 了 
进行 传输 ,检测 错误 以 及 传送 确认 信息 等 内 容 。TCP/IP 是 个 协议 族 , 它 包含 了 多 种 协议 ,ISO/OSI 
模型 、TCP/IP 的 分 层 模 型 及 协议 的 对 比如 图 10-13 所 示 。 


ISO/OSI 模 型 TCP/IP 协议 TCP/IP 模型 
应 用 层 

应 用 层 
表示 层 
会 话 层 
传输 层 传输 层 
网 络 层 网 际 层 


数据 链 路 层 | Ethermet Token-Ring/ 网 络 接口 层 
IEEE 802.3 IEEE 802.5 | ARCnet | PPP/SLIP 
物理 层 硬件 层 


图 10-13 TCP/IP 模型 与 OSI 模型 的 对 比 


从 图 10-13 可 知 ，TCP/IP 分 层 模型 由 4 个 层次 构成 ， 即 应 用 层 、 传 输 层 、 网 际 层 和 网 络 接 
口 层 ， 对 各 层 的 功能 简 述 如 下 。 

(1) 应 用 层 。 应 用 层 处 在 分 层 模 型 的 最 高 层 ， 用 户 调 用 应 用 程序 来 访问 TCP/IP 互连网 络 ， 
以 享受 网 络 上 提供 的 各 种 服务 。 应 用 程序 负责 发 送 和 接收 数据 。 每 个 应 用 程序 可 以 选择 所 需要 
的 传输 服务 类 型 ， 并 把 数据 按照 传输 层 的 要 求 组 织 好 ， 再 向 下 层 传送 ， 包 括 独立 的 报 文 序 列 和 

(2) 传输 层 。 传 输 层 的 基本 任务 是 提供 应 用 程序 之 间 的 通信 服务 ， 这 种 通信 又 称 端 到 端的 
通信 。 传 输 层 既 要 系统 地 管理 数据 信息 的 流动 ， 还 要 提供 可 靠 的 传输 服务 ， 以 确保 数据 准确 而 
有 序 地 到 达 目 的 地 。 为 了 这 个 目的 ， 传 输 层 协议 软件 需要 进行 协商 ， 让 接收 方 回 送 确认 信息 及 
让 发 送 方 重 发 丢失 的 分 组 。 在 传输 层 与 网 际 层 之 间 传 递 的 对 象 是 传输 层 分 组 。 

(3) 网 际 层 。 网 际 层 又 称 正 层 ， 主 要 处 理 机 器 之 间 的 通信 问题 。 它 接收 传输 层 请 求 ， 传 送 某 
个 具有 目的 地 址 信息 的 分 组 。 该 层 主要 完成 以 下 功能 。 

Q@ 把 分 组 封装 到 卫 数据 报 〈 耳 Datagram) 中 ， 填 入 数据 报 的 首部 〈 也 称 为 报头 )， 使 用 
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路 由 算法 选择 把 数据 报 直接 送 到 目标 机 或 把 数据 报 发 送 给 路 由 器 ， 然 后 再 把 数据 报 交 给 下 面 的 
网 络 接口 层 中 对 应 的 网 络 接口 模块 。 

@ 处 理 接收 到 的 数据 报 ， 检 验 其 正确 性 。 使 用 路 由 算法 来 决定 是 在 本 地 进行 处 理 ， 还 是 
继续 向 前 发 送 。 如 果 数 据 报 的 目标 机 处 于 本 机 所 在 的 网 络 ， 该 层 软 件 就 把 数据 报 的 报头 剥 去 ， 
再 选择 适当 的 传输 层 协议 软件 来 处 理 这 个 分 组 。 

@ 适时 发 出 ICMP 的 差错 和 控制 报 文 ， 并 处 理 收 到 的 ICMP 报 文 。 

(4) 网 络 接口 层 。 网 络 接口 层 又 称 数据 链 路 层 ， 处 于 TCP/IP 协议 层 之 下 ， 负 责 接收 琴 数 
据 报 ， 并 把 数据 报 通过 选 定 的 网 络 发 送出 去 。 该 层 包 含 设备 驱动 程序 ， 也 可 能 是 一 个 复杂 的 、 
使 用 自己 的 数据 链 路 协议 的 子 系统 。 


2. 网络 接 口 层 协议 


TCP/IP 协议 不 包含 具体 的 物理 层 和 数据 链 路 层 , 只 定义 了 网 络 接口 层 作 为 物理 层 与 网 络 层 
的 接口 规范 。 这 个 物理 层 可 以 是 广域网 , 例如 X.25 公用 数据 网 , 也 可 以 是 局 域 网 , 例如 Ethernet、 
Token-Ring 和 FDDI 等 。 任 何 物理 网 络 只 要 按照 这 个 接口 规范 开发 网 络 接口 驱动 程序 ， 就 能 够 
与 TCP/IP 协议 集成 起 来 。 网 络 接口 层 处 在 TCP/IP 协议 的 最 底层 ， 主 要 负责 管理 为 物理 网 络 准 
备 数据 所 需 的 全 部 服务 程序 和 功能 。 


3。 网 际 层 协 议 一 一 IP 


网 际 层 是 整个 TCP/IP 协议 族 的 重点 。 在 网 际 层 定 义 的 协议 除了 下 外， 还 有 ICMP、ARP 
和 RARP 等 儿 个 重要 的 协议 。 

卫 所 提供 的 服务 通常 被 认为 是 无 连接 的 〈Connectionless) 和 不 可 靠 的 (Unreliable)。 事 实 
上 , 在 网 络 性 能 良好 的 情况 下 , 卫 传送 的 数据 能 够 完好 无 损 地 到 达 目 的 地 。 所 谓 无 连接 的 传输 ， 
是 指 没 有 确定 目标 系统 在 已 做 好 接收 数据 准备 之 前 就 发 送 数据 。 与 此 相对 应 的 就 是 面向 连接 的 
(Connection Oriented) 传输 (如 TCP), 在 该 类 传输 中 , 源 系统 与 目的 系统 在 应 用 层 数 据 传送 之 
前 需要 进行 三 次 握手 。 至 于 不 可 靠 的 服务 ， 是 指 目的 系统 不 对 成 功 接收 的 分 组 进行 确认 ，P 只 
是 尽 可 能 地 使 数据 传输 成 功 。 但 是 只 要 需要 ， 上 层 协 议 必须 实现 用 于 保证 分 组 成 功 提供 的 附加 
服务 。 

由 于 耳 只 提供 无 连接 、 不 可 靠 的 服务 ， 所 以 把 差错 检测 和 流量 控制 之 类 的 服务 授权 给 了 其 
他 的 各 层 协议 ， 这 正 是 TCP/IP 能 够 高 效 工 作 的 一 个 重要 保证 。 这 样 ， 可 以 根据 传送 数据 的 属 
性 来 确定 所 需 的 传送 服务 以 及 客户 应 该 使 用 的 协议 。 例如， 传送 大 型 文件 的 FTP 会 话 需要 面向 
连接 的 、 可 靠 的 服务 (因为 如 果 稍 有 损坏 ， 就 可 能 导致 整个 文件 无 法 使 用 )。 
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卫 的 主要 功能 包括 将 上 层 数 据 ( 如 TCP、UDP 数据 ) 或 同 层 的 其 他 数据 (如 ICMP 数据 ) 
封装 到 人 P 数据 报 中 ; 将 卫 数据 报 传送 到 最 终 目的 地 ;为 了 使 数据 能 够 在 链 路 层 上 进行 传输 ， 
对 数据 进行 分 段 ， 确 定数 据 报到 达 其 他 网 络 中 的 目的 地 的 路 径 。 

IP 协议 软件 的 工作 流程 : 当 发 送 数据 时 ， 源 计算 机 上 的 了 P 协议 软件 必须 确定 目的 地 是 在 
同一 个 网 络 上 ， 还 是 在 另 一 个 网 络 上 。]IP 通过 执行 这 两 项 计算 并 对 结果 进行 比较 ， 才 能 确定 数 
据 到 达 的 目的 地 。 如 果 两 项 计算 的 结果 相同 ， 则 数据 的 目的 地 确定 为 本 地 ;和 否则， 目的 地 应 为 
远程 的 其 他 网 络 。 如 果 目 的 地 在 本 地 ,那么 人 P 协议 软件 就 启动 直达 通信 ; 如 果 目 的 地 是 远程 计 
算 机 ,那么 IP 必须 通过 网 关 (或 路 由 器 ) 进行 通信 ， 在 大 多 数 情况 下 ， 这 个 网 关 应 当 是 默认 网 
关 。 当 源 下 完成 了 数据 报 的 准备 工作 时 ， 它 就 将 数据 报 传递 给 网 络 访问 层 ， 网 络 访问 层 再 将 数 
据 报 传送 给 传输 介质 ， 最 终 完成 数据 帧 发 往 目的 计算 机 的 过 程 。 

当 数 据 抵达 目的 计算 机 时 ， 网 络 访问 层 首先 接收 该 数据 。 网 络 访问 层 要 检查 数据 帧 有 无 错 
误 ， 并 将 数据 帧 送 往 正确 的 物理 地 址 。 假 如 数据 帧 到 达 目 的 地 时 正确 无 误 ， 网 络 访问 层 便 从 数 
据 帧 的 其 余部 分 中 提取 数据 有 效 负载 (Payload)， 然 后 将 它 一 直 传送 到 帧 层次 类 型 域 指定 的 协 
议 。 在 这 种 情况 下 ， 可 以 说 数据 有 效 负载 已 经 传递 给 了 卫 。 

有 关 也 地 址 的 具体 情况 参见 10.4.2 节 的 内 容 。 

4. ARP 和 RARP 


地 址 解析 协议 (Address Resolution Protocol，ARP) 及 反 地 址 解析 协议 (RARP) 是 驻 留 在 
网 际 层 中 的 另 一 个 重要 协议 。 ARP 的 作用 是 将 人 P 地址 转换 为 物理 地 址 , RARP 的 作用 是 将 物理 
地 址 转换 为 他 地 址 。 网 络 中 的 任何 设备 ， 主 机 、 路 由 器 和 交换 机 等 均 有 唯一 的 物理 地 址 ， 该 地 
址 通过 网 卡 给 出 ， 每 个 网 卡 出 三 后 都 有 不 同 的 编号 ， 这 意味 着 用 户 所 购买 的 网 卡 有 着 唯一 的 物 
理 地 址 。 另 一 方面 ， 为 了 屏蔽 底层 协议 及 物理 地 址 上 的 差异 ， 卫 协议 又 使 用 了 下 地 址 ， 因 此 ， 
在 数据 传输 过 程 中 ， 必 须 对 人 P 地 址 与 物理 地 址 进行 相互 转换 。 

用 ARP 进行 PP 地址 到 物理 地 址 转换 的 过 程 为 ， 当 计算 机 需要 与 任何 其 他 的 计算 机 进行 通 
信 时 ， 首先 需要 查询 ARP 高 速 缓存 ， 如 果 ARP 高 速 缓存 中 这 个 人 P 地 址 存在 ,使 使 用 与 它 对 应 
的 物理 地 址 直接 将 数据 报 发 送 给 所 需 的 物理 网 卡 ， 如 果 ARP 高 速 缓存 中 没有 该 他 地 址 ， 那 么 
ARP 便 在 局 域 网 上 以 广播 方式 发 送 一 个 ARP 请 求 包 。 如 果 局 域 网 上 IP 地 址 与 某 台 计算 机 中 的 
了 P 地 址 相 一 致 ， 那 么 该 计算 机 便 生成 一 个 ARP 应 答 信息 ， 信 息 中 包含 对 应 的 物理 地 址 。ARP 
协议 软件 将 中 地址 与 物理 地 址 的 组 合 添加 到 它 的 高 速 缓存 中 ， 这 时 即 可 开始 数据 通信 。 

RARP 负责 物理 地 址 到 人 P 地 址 的 转换 , 这 主要 用 于 无 盘 工 作 站 。 网 络 上 的 无 盘 工 作 站 在 网 
卡 上 有 自己 的 物理 地 址 , 但 无 P 地 址 ， 因 此 必须 有 一 个 转换 过 程 。 为 了 完成 这 个 转换 过 程 ， 网 
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络 中 有 一 个 RARP 服务 器 ， 网 络 管理 员 事先 必须 把 网 卡 上 的 IP 地 址 和 相应 的 物理 地 址 存储 到 
卫 RARP 服务 器 的 数据 库 中 。 


$5. 网 际 层 协议 一 一 ICMP 


Internet 控制 信息 协议 〈Intemet Control Message Protocol，ICMP) 是 网 际 层 的 另 一 个 比较 
重要 的 协议 。 由 于 正 是 一 种 尽力 传送 的 通信 协议 ， 即 传送 的 数据 报 可 能 丢失 、 重 复 、 延 迟 或 乱 
序 ， 因 此 了 正 需要 一 种 避免 差错 并 在 发 生 差错 时 报告 的 机 制 。ICMP 就 是 一 个 专门 用 于 发 送 差错 
报 文 的 协议 。ICMP 定义 了 5 种 差错 报 文 〈 源 抑制 、 超 时 、 目 的 不 可 达 、 重 定向 和 要 求 分 段 ) 
和 4 种 信息 报 文 〈 回 应 请 求 、 回 应 应 答 、 地 址 屏蔽 码 请 求 和 地 址 屏蔽 码 应 答 )。 了 严 在 需要 发 送 
一 个 差错 报 文 时 要 使 用 ICMP， 而 ICMP 也 是 利用 他 来 传送 报 文 的 。ICMP 是 让 了 正 更 加 稳固 、 
有 效 的 一 种 协议 ， 它 使 得 卫 传送 机 制 变 得 更 加 可 靠 。 而且 ICMP 还 可 以 用 于 测试 因特网 ， 以 得 
到 一 些 有 用 的 网 络 维护 和 排 错 的 信息 。 例如， 著名 的 ping 工具 就 是 利用 ICMP 报 文 进行 目标 是 
否 可 达 测 试 。 


6. 传输 层 协 议 一 一 TCP 


TCP 〈Transmission Control Protocol， 传 输 控制 协议 ) 是 整个 TCP/IP 协议 族 中 最 重要 的 协 
议 之 一 。 它 在 四 提供 的 不 可 靠 数 据 服务 的 基础 上 为 应 用 程序 提供 了 一 个 可 靠 的 、 面 向 连接 的 、 
全 双 工 的 数据 传输 服务 。 

TCP 是 如 何 实现 可 靠 性 的 呢 ? 最 主要 和 最 重要 的 是 TCP 采用 了 重 发 (Retransmission) 技术 。 
具体 来 说 ， 在 TCP 传输 过 程 中 ， 发 送 方 启动 一 个 定时 器 ， 然 后 将 数据 包 发 出 ， 当 接收 方 收 到 了 
这 个 信息 时 就 给 发 送 方 一 个 确认 (Acknowledgement) 信息 。 如 果 发 送 方 在 定时 器 到 点 之 前 没 
有 收 到 这 个 确认 信息 ， 就 重新 发 送 这 个 数据 包 。 

利用 TCP 在 源 主机 和 目的 主机 之 间 建 立 和 关闭 连接 操作 时 ， 均 需要 通过 三 次 握手 来 确认 
建立 和 关闭 是 否 成 功 。 三 次 握手 方式 如 图 10-14 所 示 ， 它 通过 “序号 /确认 号 ”使 得 系统 正常 工 
作 ， 从 而 使 它们 的 序号 达成 同步 。TCP 建立 连接 的 三 次 握手 过 程 如 下 。 


© SYN SEQ=200 


©@ ACK 201, SYN SEQ=350 
一 


ey 图 ACK 351 


图 10-14 TCP 建立 连接 的 “三 次 握手 ”过 程 
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(1) 源 主机 发 送 一 个 SYN (同步 ) 标志 位 为 1 的 TCP 数据 包 ， 表 示 想 与 目标 主机 进行 通 
信 ， 并 发 送 一 个 同步 序列 号 (如 SEQ=200) 进行 同步 。 

(2) 目标 主机 同意 进行 通信 ， 则 响应 一 个 确认 ACK 位 置 1)， 并 以 下 一 个 序列 号 为 参考 
进行 确认 如 201)。 

(3) 源 主机 以 确认 来 响应 目标 主机 的 TCP 包 ， 这 个 确认 中 包括 它 想 要 接收 的 下 一 个 序列 
号 (该 帧 可 以 含有 发 送 的 数据 )。 至 此 连接 建立 完成 。 

同样 ， 关 闭 连 接 也 进行 三 次 握手 。 

7. 传输 层 协 议 一 一 UDP 


用 户 数据 报 协 议 (User Datagram Protocol，UDP) 是 一 种 不 可 靠 的 、 无 连接 的 协议 ， 可 以 
保证 应 用 程序 进程 间 的 通信 。 与 同样 处 在 传输 层 的 面向 连接 的 TCP 相 比 ，UDP 是 一 种 无 连接 
的 协议 ， 它 的 错误 检测 功能 要 弱 得 多 。 可 以 这 样 说 ，TCP 有 助 于 提供 可 靠 性 ， 而 UDP 有 助 于 
提高 传输 的 高 速率 性 。 例 如 ， 必 须 支持 交互 式 会 话 的 应 用 程序 (如 FTP 等 ) 往往 使 用 TCP; 而 
自己 进行 错误 检测 或 不 需要 错误 检测 的 应 用 程序 (如 DNS、SNMP 等 ) 往往 使 用 UDP。 

UDP 协议 软件 的 主要 作用 是 将 UDP 消息 展示 给 应 用 层 ， 它 并 不 负责 重新 发 送 丢 失 的 或 出 
错 的 数据 消息 ， 不 对 接收 到 的 无 序 了 P 数据 报 重新 排序 ， 不 消除 重复 的 了 P 数据 报 ， 不 对 已 收 到 
的 数据 报 进行 确认 ， 也 不 负责 建立 或 终止 连接 。 这 些 问 题 是 由 使 用 UDP 进行 通信 的 应 用 程序 
负责 处 理 的 。 

TCP 虽然 提供 了 一 个 可 靠 的 数据 传输 服务 ， 但 它 是 以 牺牲 通信 量 来 实现 的 。 也 就 是 说 ， 为 
了 完成 同样 一 个 任务 ，TCP 需要 更 多 的 时 间 和 通信 量 。 这 在 网 络 不 可 靠 的 时 候 通过 牺牲 一 些 时 
间 换 来 达到 网 络 的 可 靠 性 是 可 行 的 ， 但 在 网 络 十 分 可 靠 的 情况 下 ， 则 可 以 采用 UDP， 通 信 量 的 
浪费 就 会 很 小 。 

8. 应 用 层 协议 

随 着 计算 机 网 络 的 广泛 应 用 ， 人 们 也 已 经 有 了 许多 基本 的 、 相 同 的 应 用 需求 。 为 了 让 不 同 
平台 的 计算 机 能 够 通过 计算 机 网 络 获得 一 些 基本 的 、 相 同 的 服务 ， 也 就 应 运 而 生 了 一 系列 应 用 
级 的 标准 ， 实 现 这 些 应 用 标准 的 专用 协议 被 称 为 应 用 级 协议 ， 相 对 于 OSI 参考 模型 来 说 ， 它 们 
处 于 较 高 的 层次 ， 所 以 也 称 为 高 层 协议 。 应 用 层 的 协议 有 NFS、Telnet、SMTP、DNS、SNMP 
和 FTP 等， 详细 情况 将 在 Internet 服务 中 介绍 。 


10.4 Internet 及 应 用 


Intemet 是 世界 上 规模 最 大 、 覆 盖 面 最 广 生 最 具 影 响 力 的 计算 机 互连网 络 ， 它 是 将 分 布 在 


so 
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世界 各 地 的 计算 机 采用 开放 系统 协议 连接 在 一 起 ， 用 来 进行 数据 传输 、 信 息 交换 和 资源 共享 。 
在 现 阶 段 ，Internet 作为 未 来 信息 高 速 公路 的 锥 形 , 无 论 在 科学 研究 、 教育、 金融, 还 是 在 商业 、 
军事 等 部 门 ， 其 影响 都 越 来 越 大 。 


10.4.1 Internet 概述 


从 用 户 的 角度 来 看 ， 整 个 Intemet 在 逻辑 上 是 统一 的 、 独 立 的 ， 在 物理 上 则 由 不 同 的 网 络 
互 连 而 成 。 从 技术 角度 看 ，Internet 本 身 不 是 某 一 种 具体 的 物理 网 络 技术 ， 它 是 能 够 互相 传递 信 
息 的 众多 网 络 的 一 个 统称 ， 或 者 说 它 是 一 个 网 间 网 ， 只 要 人 们 进入 了 这 个 互联 网 ， 就 是 在 使 用 
Internet。 正 是 由 于 Intemet 的 这 种 特性 ， 使 得 广大 Intemet 用 户 不 必 关 心 网 络 的 连接 ， 而 只 关心 
网 络 提供 的 丰富 资源 。 

连 入 Intemet 的 计算 机 网 络 种 类 繁多 、 形 式 各 异 ， 且 分 布 在 世界 各 地 ， 因 此 ， 需 要 通过 路 
由 器 (IP 网关) 并 借助 各 种 通信 线路 或 公共 通信 网 络 把 它们 连接 起 来 。 由 于 实现 了 与 公用 电话 
网 的 互 连 , 个 人 用 户 入 网 十 分 方便 ， 只 要 有 电话 和 Modem 即 可 ， 这 也 是 Internet 迅速 普及 的 原 
因 之 一 。Internet 由 美国 的 ARPANET 网 络 发 展 而 来 , 因此 , 它 沿用 了 ARPANET 使 用 的 TCP/IP 
协议 ， 由 于 该 协议 非常 有 效 且 使 用 方便 ， 许 多 操作 系统 都 支持 它 ， 无 论 是 服务 器 还 是 个 人 计算 
机 都 可 安装 使 用 。 

对 于 全 球 性 最 大 的 互联 网 络 ， 总 的 来 说 无 确定 的 负责 人 ， 它 是 由 各 自 独 立 管理 的 网 络 互联 
构成 的 ， 而 这 些 网 络 各 自 拥 有 自己 的 管理 体系 和 政策 法 规 。 因 此 ， 没 有 集中 的 负责 掌管 整个 
Internet 的 机 构 。 尽 管 如 此 ， 某 些 政府 部 门 在 制定 Internet 有 关 政 策 时 实际 上 起 着 主导 作用 。 
Internet 目前 的 最 高 国际 组 织 是 Intemet 学 会 (Intemet Society)， 该 学 会 是 一 个 志愿 者 组 织 ， 也 
是 一 个 非 盘 利 性 的 专业 化 组 织 ， 其 主要 目标 是 促进 Intemet 的 改革 与 发 展 。 该 学 会 下 分 Internet 
体系 结构 研究 会 (IAB) 和 其 他 几 个 研究 会 , IAB 下 又 有 工程 组 (IETF)、 许可 证 管理 局 (ICRS)、 
技术 研究 组 〈IRTF) 和 编号 管理 局 (IANA) 等 。IAB 的 主要 任务 是 为 支持 Internet 的 科研 与 
发 提供 服务 。 

在 Intemet 中 分 布 着 一 些 覆盖 范围 很 广 的 大 网 络 ， 这 种 网 络 称 为 “Intemet 主干 网 ”它们 
一 般 属 于 国家 级 的 广域网 。 例 如 ， 我 国 的 CHINANET 和 CERNET 等 就 是 中 国 的 Intemet 主干 
网 。 主 干 网 一 般 只 延伸 到 一 些 大 城市 或 重要 地 方 ， 在 那里 设立 主干 网 结 点 。 每 一 个 主干 网 结 点 
可 以 通过 路 由 器 将 广域网 与 局 域 网 连接 起 来 ， 一 个 结 点 还 可 以 通过 另外 的 路 由 器 与 其 他 局 域 网 
再 互 连 ， 由 此 形成 一 种 网 状 结构 。 


10.4.2 Internet 地 址 


无 论 是 在 网 上 检索 信息 还 是 发 送 电子 邮 件 ， 都 必须 知道 对 方 的 ntemet 地 址 ， 它 能 唯一 确 
定 Intermet 上 的 每 一 台 计算 机 、 每 个 用 户 的 位 置 。 也 就 是 说 ，Intemet 上 的 每 一 台 计 算 机 、 每 个 
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用 户 都 有 唯一 的 地 址 来 标识 它 是 谁 和 在 何 处 ， 以 方便 于 几 千 万 个 用 户 、 几 百 万 台 计 算 机 和 成 千 
上 万 的 组 织 。Intemet 地 址 格式 主要 有 两 种 书写 形式 : 域名 格式 和 人 P 地 址 格式 。 


1. 域名 


域名 (Domain Name) 通常 是 用 户 所 用 的 主机 的 名 字 或 地 址 。 域 名 格式 由 若干 部 分 组 成 ， 
每 个 部 分 又 称 子 域名 ， 它 们 之 间 用 “.” 分 开 ， 每 个 部 分 最 少 由 两 个 字母 或 数字 组 成 。 域 名 通常 
按 分 层 结构 来 构造 ， 每 个 子 域名 都 有 其 特定 的 含义 。 通 常情 况 下 ， 一 个 完整 、 通 用 的 层次 型 主 
机 域名 由 以 下 4 个 部 分 组 成 : 

计算 机 主机 名 . 本 地 名 . 组 名 . 最 高 层 域名 

从 右 到 左 ， 子 域名 分 别 表示 不 同 的 国家 或 地 区 的 名 称 (只 有 美国 可 以 省 略 表 示 国 家 的 顶级 
域名 )、 组 织 类 型 、 组 织 名 称 、 分 组 织 名 称 和 计算 机 名 称 等 。 域 名 地 址 的 最 后 一 部 分 子 域名 称 
为 高 层 域名 〈 或 项 级 域名 )， 它 大 致 上 可 以 分 成 两 类 : 一 类 是 组 织 性 顶级 域名 ; 另 一 类 是 地 理 
性 顶级 域名 。 

例如 : www.dzkjdx.edu.cn cn 是 地 理性 顶级 域名 ， 表 示 “ 中 国 ”。 

www.263.net net 是 组 织 性 顶级 域名 ， 表 示 “ 网 络 技术 组 织 机 构 ”。 

如 果 一 个 主机 所 在 的 网 络 级 别 较 高 , 它 可 能 拥有 的 域名 仅 包含 3 个 部 分 : 本 地 名 . 组 名 . 最 
高 层 域名 。 现 在 ,Intemet 地 址 管理 机 构 (Internet PCA Registration Authority, IPRA) 和 (Intemet 
Assigned Number Authority，IANA) 负责 Internet 最 高 层 域名 的 登记 和 管理 。 


2. IP 地 址 


Intemet 地 址 是 按 名 字 来 描述 的 ， 这 种 地 址 表示 方式 易于 理解 和 记忆 。 实 际 上 ，Internet 中 
的 主机 地 址 是 用 下 地 址 来 唯一 标识 的 。 这 是 因为 Intemet 中 所 使 用 的 网 络 协 议 是 TCP/IP 协议 ， 
故 每 个 主机 必须 用 下 地 址 来 标识 。 

每 个 也 地 址 都 由 4 个 小 于 256 的 数字 组 成 ， 数 字 之 间 用 “.” 分 开 。Intemet 的 人 P 地 址 共 
有 32 位 ，4 个 字 节 。 它 有 两 种 表示 格式 : 二 进 制 格式 和 十 进 制 格式 。 二 进 制 格式 是 计算 机 所 认 
识 的 格式 , 十进制 格式 是 由 二 进 制 格式 “翻译 ”过 去 的 ， 主 要 是 为 了 便于 使 用 和 掌握 。 例如， 十 进 
制 卫 地址 129.102.4.11 与 二 进 制 的 10000001 01100110 00000100 00001011 相同 ， 显然 表 示 成 带 点 
的 十 进 制 格式 方 使 得 多 。 

域名 和 他 地 址 是 一 一 对 应 的 ， 域 名 易于 记忆 、 便 于 使 用 ， 因 此 得 到 比较 普遍 的 使 用 。 当 
用 户 和 Internet 上 的 某 台 计算 机 交换 信息 时 ， 只 需要 使 用 域名 ， 网 络 会 自动 地 将 其 转换 成 卫 地 址 ， 
找到 该 台 计算 机 。 

Internet 中 的 地 址 可 分 为 5 类: A 类 、B 类 、C 类 、D 类 和 EE 类 。 各 类 的 地 址 分 配方 案 如 图 
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10-15 所 示 。 在 下 地 址 中 ,全 0 代表 的 是 网 络 ， 全 1 代表 的 是 广播 。 


01 78 16 24 31 
A 类 : [0 [四 络 地 址 | 主机 地 址 (24) 
012 1516 24 31 


B 类 : [10 | 网络 地 址 (14) | 主机 地 址 (16) | 


0123 24 


31 
C 类 :| 110 网 络 地 址 (21) 主机 地 址 


01234 24 31 


D 类 ; 组 播 、 路 由 器 修改 (28) 


01234 24 31 
E 类 : 试验 用 地 址 (28) 


图 10-15 各 类 地 址 分 配方 案 


A 类 网 络 地 址 占有 1 个 字 节 (8 位 )， 定义 最 高 位 为 0 来 标识 此 类 地 址 , 余下 7 位 为 真正 的 
网 络 地 址 ， 支 持 1 一 126 个 网 络 。 后 面 的 3 个 字 节 (24 位 ) 为 主机 地 址 ， 共 提供 224-2 个 端点 的 
寻 址 。A 类 网 络 地 址 第 一 个 字 节 的 十 进 制 值 为 000 一 127。 

B 类 网 络 地 址 占有 两 个 字 节 ， 使 用 最 高 两 位 为 10 来 标识 此 类 地 址 ， 其 余 14 位 为 真正 的 网 
络 地 址 ， 主 机 地 址 占 后 面 的 两 个 字 节 〈16 位 )， 所 以 B 类 全 部 的 地 址 有 (2:4-2) X (2!_2) = 
16382X65 534 个 。B 类 网 络 地 址 第 一 个 字 节 的 十 进 制 值 为 128 一 191。 

C 类 网 络 地 址 占有 3 个 字 节 ， 它 是 最 通用 的 Internet 地 址 。 使 用 最 高 三 位 为 110 来 标识 此 
类 地 址 ， 其 余 21 位 为 真正 的 网 络 地 址 ， 因 此 C 类 地 址 支持 22-2 个 网 络 。 主 机 地 址 占 最 后 1 个 
字 节 ， 每 个 网 络 可 多 达 28_2 个 主机 。C 类 网 络 地 址 第 一 个 字 节 的 十 进 制 值 为 192 一 223。 

D 类 地 址 是 相当 新 的 。 它 的 识别 头 是 1110， 用 于 组 播 ， 例 如 用 于 路 由 器 修改 。D 类 网 络 地 
址 第 一 个 字 节 的 十 进 制 值 为 224 一 239。 

E 类 地 址 为 实验 保留 , 其 识别 头 是 1111。E 类 网 络 地 址 第 一 个 字 节 的 十 进 制 值 为 240 一 255。 

网 络 软 件 和 路 由 器 使 用 子 网 掩 码 (Subnet Mask) 来 识别 报 文 是 仅 存放 在 网 络 内 部 还 是 被 路 
由 转发 到 其 他 地 方 。 在 一 个 字段 内 ，1 的 出 现 表明 一 个 字段 包含 所 有 或 部 分 网 络 地 址 ，0 表明 
主机 地 址 位 置 。 例 如 ， 最 常用 的 C 类 地 址 使 用 前 3 个 字 节 来 识别 网 络 ， 最 后 一 个 字 节 (8 位) 
识别 主机 。 因 此 ， 子 网 掩 码 是 255.255.255.0。 

子 网 地 址 掩 码 是 相对 特别 的 人 P 地 址 而 言 的 ， 如 果 脱 离 了 了 P 地 址 就 毫 无 意义 。 它 的 出 现 一 
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般 是 跟着 一 个 特定 的 瑟 地址 , 用 来 为 计算 这 个 人 P 地 址 中 的 网 络 号 部 分 和 主机 号 部 分 提供 依据 。 

换 句 话说 ,就 是 在 写 一 个 他 地 址 后 ， 用 于 指明 哪些 是 网 络 号 部 分 ， 哪 些 是 主机 号 部 分 。 子 网 掩 

码 的 格式 与 瑟 地 址 相同 ， 所 有 对 应 网 络 号 的 部 分 用 1 填 上 ， 所 有 对 应 主机 号 的 部 分 用 0 填 上 。 
A 类 、B 类 、C 类 了 P 地 址 类 默认 的 子 网 掩 码 如 表 10-2 所 示 。 


表 10-2 带 点 十 进 制 符 号 表示 的 默认 子 网 掩 码 


地 址 类 子 网 掩 码 位 
A 类 | 11111111 00000000 00000000 00000000 
B 类 11111111 11111111 00000000 00000000 


11111111 11111111 11111111 00000000 


如 果 需 要 将 网 络 进行 子 网 划分 ， 此 时 子 网 掩 码 可 能 不 同 于 以 上 默认 的 子 网 掩 码 。 例 如 ， 
138.96.58.0 是 一 个 8 位 子 网 化 的 B 类 网 络 ID.。 基于 B 类 的 主机 ID 的 8 位 被 用 来 表示 子 网 化 的 
网 络 ， 对 于 网 络 138.96.39.0， 其 子 网 掩 码 应 为 255.255.255.0。 

例如 ， 一 个 B 类 地 址 172.16.3.4， 为 了 直观 地 说 明 前 16 位 是 网 络 号 ， 后 16 位 是 主机 号 ， 
可 以 附 上 子 网 掩 码 255.255.0.0(11111111 11111111 00000000 00000000)。 

假定 某 单位 申请 的 B 类 地 址 为 179.143.X X X.X X x 。 如 果 希 望 把 它 划分 为 14 (至 少 占 

- 进 制 的 4 位 ) 个 虚拟 的 网 络 , 则 需要 占 4 位 主机 位 , 子 网 使 用 掩 码 255.255.240.0 一 255.255.255.0 
来 建立 子 网 。 每 个 LAN 可 有 2:2_2 个 主机 ， 且 各 子 网 可 具有 相同 的 主机 地 址 。 

假设 一 个 组 织 有 几 个 相对 大 的 子 网 ， 每 个 子 网 包括 了 25 台 左 右 的 计算 机 ; 而 又 有 一 些 相 对 较 
小 的 子 网 ， 每 个 子 网 大 概 只 有 几 台 计算 机 。 在 这 种 情况 下 ， 可 以 将 一 个 C 类 地 址 分 成 6 个子 网 
(每 个 子 网 可 以 包含 30 台 计 算 机 )， 这 样 解决 了 很 大 的 问题 。 但 是 出 现 了 一 个 新 的 情况 ， 那 就 
是 大 的 子 网 基本 上 完全 利用 了 IP 地 址 范围 ， 小 的 子 网 却 造成 了 许多 了 P 地 址 的 浪费 。 为 了 解决 
这 个 新 的 难题 ， 避 免 任 何 的 卫 浪费 ， 出 现 了 允许 应 用 不 同 大 小 的 子 网 掩 码 来 对 IP 地 址 空间 进 
行 子 网 划分 的 解决 方案 。 这 种 新 的 方案 称 为 可 变 长 子 网 掩 码 (VLSM)。 

VLSM 用 一 个 十 分 直观 的 方法 来 表示 ， 那 就 是 在 P 地 址 后 面 加 上 “/ 网 络 号 及 子 网 络 号 编 
址 位 数 ”。 例 如 ，193.168.125.0/27 就 表示 前 27 位 表示 网 络 号 。 

例如 ， 给 定 135.41.0.0/16 的 基于 B 类 的 网 络 ID， 所 需 的 配置 是 为 将 来 使 用 保留 一 半 的 地 
址 ， 其 余 的 生成 15 个 子 网 ， 达 到 2000 台 主 机 。 

由 于 要 为 将 来 使 用 保留 一 半 的 地 址 ， 完 成 了 135.41.0.0 的 基于 B 类 的 网 络 ID 的 1 位 子 网 
化 ， 生 成 两 个 子 网 135.41.0.0/17 和 135.41.128.0/17， 子 网 135.41.128.0/17 被 选 作为 将 来 使 用 所 
保留 的 地 址 部 分 ，135.41.0.0/17 被 继续 生成 子 网 。 

为 达到 划分 2000 台 主 机 的 15 个 子 网 的 要 求 ， 需 要 将 135.41.128.0/17 的 子 网 化 的 网 络 了 D 


子 网 掩 码 
255.0.0.0 

255.255.0.0 
255.255.255.0 
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的 4 位 子 网 化 。 这 就 产生 了 16 个 子 网 (135.41.128.0/21、135.41.136.0/21、…、135.41.240.0/21、 
135.41.248.0/21)， 人 允许 每 个 子 网 有 2046 台 主 机 。 最 初 的 15 个 子 网 化 的 网 络 ID (135.41.128.0/ 
21 一 135.41.240.0/21) 被 选 定 为 网 络 ID， 从 而 实现 了 要 求 。 

现在 的 中 协议 的 版 本 号 为 4， 所 以 也 称 之 为 Pv4, 为 了 方便 网 络 管理 员 阅 读 和 理解 ， 使 用 
4 个 十 进 制 数 中 间 加 小 数 点 “.” 来 表示 。 但 随 着 因特网 的 膨胀 ，IPv4 不 论 从 地 址 空间 上 ， 还 是 
协议 的 可 用 性 上 都 无 法 满足 因特网 的 新 要 求 。 这 样 出 现 了 一 个 新 的 中 协议 一 一 Pv6， 它 使 用 8 
个 十 六 进 制 数 中 间 加 “: ”来 表示 。IPv6 将 原来 的 32 位 地 址 扩展 成 为 128 位 地 址 ， 彻 底 解决 了 
地 址 缺乏 的 问题 。 


3. NAT 技术 


因特网 面临 他 地 址 短缺 的 问题 。 解 决 这 个 问题 有 所 谓 长 期 的 或 短期 的 两 种 解决 方案 。 长 期 的 
解决 方案 就 是 使 用 具有 更 大 地 址 空间 的 IPv6 协议 ， 网 络 地 址 翻译 (Network Address Translators， 
NAT) 是 许多 短期 的 解决 方案 中 的 一 种 。 

NAT 技术 最 初 提出 的 建议 是 在 子 网 内 部 使 用 局 部 地 址 ， 而 在 子 网 外 部 使 用 少量 的 全 局 地 
址 ， 通 过 路 由 器 进行 内 部 和 外 部 地 址 的 转换 。NAT 的 实现 主要 有 两 种 形式 。 

第 一 种 应 用 是 动态 地 址 翻译 (Dynamic Address Translation)。 为 此 , 首先 引入 存根 域 的 概念 ， 
所 谓 存根 域 (Stub Domain)， 就 是 内 部 网 络 的 抽象 ， 这 样 的 网 络 只 处 理 源 和 目标 都 在 子 网 内 部 
的 通信 。 任 何 时 候 存 根 域内 只 有 一 部 分 主机 要 与 外 界 通 信 ， 甚 至 还 有 许多 主机 可 能 从 不 与 外 界 
通信 ， 所 以 整个 存根 域 只 需 共享 少量 的 全 局 中 地址。 存根 域 有 一 个 边界 路 由 器 ， 由 它 来 处 理 域 
内 与 外 部 的 通信 。 假 定 

。 m: 需要 翻译 的 内 部 地 址 数 。 

。 1: 可 用 的 全 局 地 址 数 CNAT 地 址 )。 

当 m:n 翻译 满足 条 件 (mz1 且 mm) 时 ， 可 以 把 一 个 大 的 地 址 空间 映像 到 一 个 小 的 地 址 
空间 。 所 有 NAT 地 址 放 在 一 个 缓冲 区 中 , 并 在 存根 域 的 边界 路 由 器 中 建立 一 个 局 部 地 址 和 全 局 
地 址 的 动态 映像 表 ， 如 图 10-16 所 示 。 这 个 图 显示 的 是 把 所 有 B 类 网 络 138.201 中 的 下 地址 翻 
译 成 C 类 网 络 178.201.112 中 的 下 地 址 。 这 种 NAT 地 址 重用 有 以 下 特点 。 

(1) 只 要 缓冲 区 中 存在 尚未 使 用 的 C 类 地 址 ， 任 何 从 内 向 外 的 连接 请 求 都 可 以 得 到 响应 ， 
并 且 在 边界 路 由 器 的 动态 NAT 表 中 为 之 建立 一 个 映像 表 项 。 

(2) 如 果 内 部 主机 的 映像 存在 ， 就 可 以 利用 它 建立 连接 。 

(3) 从 外 部 访问 内 部 主机 是 有 条 件 的 ， 即 动态 NAT 表 中 必须 存在 该 主机 的 映像 。 

动态 地 址 翻译 的 好 处 是 节约 了 全 局 适用 的 下 地 址 ， 而 且 不 需要 改变 子 网 内 部 的 任何 配置 ， 
只 需 在 边界 路 由 器 中 设置 一 个 动态 地 址 变换 表 就 可 以 工作 了 。 
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SRC 138.201.148.32 SRC 178.201.112.34 


SRC 138.201.148.151 
DST 138.201.148.151… 


SRC 178.201.112.11 
DST 178.201.112.11 


动态 NAT 表 
内 部 人 p | NATP 


138.201.148.32 178.201.112.34 SRC : 源 地 址 
138.201.148.151 178.201.112.11 DST: 目标 地 址 


图 10-16 动态 网 络 地 址 翻译 


另外 一 种 特殊 的 NAT 应 用 是 m : 1 翻译 ， 这 种 技术 也 称 为 伪装 (Masquerading)， 因 为 用 
一 个 路 由 器 的 了 P 地 址 就 可 以 把 子 网 中 所 有 主机 的 人 P 地 址 都 隐藏 起 来 。 如 果子 网 中 有 多 个 主机 
要 同时 通信 ， 那 么 还 要 对 端口 号 进行 翻译 ， 所 以 这 种 技术 常 被 称 为 网 络 地 址 和 端口 翻译 
(Network Address Port Translation，NAPT)。 在 很 多 NAPT 实现 中 ,专门 保留 一 部 分 端口 号 给 伪 
装 使 用 ， 称 为 伪装 端口 号 。 图 10-17 中 的 NAT 路 由 器 中 有 一 个 伪装 表 ， 通过 这 个 表 对 端口 号 进 
行 翻译 ， 从 而 隐藏 了 内 部 网 络 138.201 中 的 所 有 主机 。 可 以 看 出 ， 这 种 方法 有 以 下 特点 。 
SRC 195.112.12.161:63451 
DST 193.46.94.115:80 


SRC 138.201.148.32 :1275 
DST 193.46.94.115:80 


SRC 138.201.160.201:4192 
DST 53.12.198.15: 23* 


“|SRC195.112.12.161:63452 
“| DSTS3.12.198.15: 23 


伪装 NAT 表 


内 部 IP/ 端 口号 本 地 NAT 端口 


SRC: 源 地 址 


38.201.148.32:1275 
138.2 12 63451 DST: 目标 地 址 


138.201.160.201:4192 63452 


图 10-17 地 址 伪装 


(1) 出 口 分 组 的 源 地 址 被 路 由 器 的 外 部 下 地 址 所 代替 ， 出 口 分 组 的 源 端口 号 被 一 个 未 使 
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用 的 伪装 端口 号 所 代替 。 

(2) 如 果 进 来 的 分 组 的 目标 地 址 是 本 地 路 由 器 的 人 P 地 址 ， 而 目标 端口 号 是 路 由 器 的 伪装 
端口 号 ， 则 NAT 路 由 器 就 检查 该 分 组 是 否 为 当前 的 一 个 伪装 会 话 ， 并 试图 通过 它 的 伪装 表 对 
四 地址 和 端口 号 进行 翻译 。 

伪装 技术 可 以 作为 一 种 安全 手段 使 用 ， 借 以 限制 外 部 对 内 部 主机 的 访问 。 另 外 ， 还 可 以 用 
这 种 技术 实现 虚拟 主机 和 虚拟 路 由 ， 以 便 达 到 负载 均衡 和 提高 可 靠 性 的 目的 。 


4. IPv6 简介 


IPv4 (PP version 4) 标准 是 20 世纪 70 年 代 末 期 制定 完成 的 。20 世纪 90 年 代 初 期 ， WWW 
的 应 用 导致 因特网 爆炸 性 发 展 ， 随 着 因特网 应 用 类 型 日 趋 复杂 ， 终 端 形式 特别 是 移动 终端 的 多 
样 化 ， 全 球 独立 人 P 地 址 的 提供 已 经 开始 面临 沉重 的 压力 。IPv4 将 不 能 满足 因特网 长 期 发 展 的 
需要 ， 必 须 立 即 开始 下 一 代 下 网 络 协议 的 研究 。 由 此 ，IETF 于 1992 年 成 立 了 IPNG (IP Next 
Generation) 工作 组 ; 1994 年 夏 ，IPNG 工作 组 提出 了 下 一 代 下 网 络 协议 (IP version 6，IPv6) 
的 推荐 版 本 ; 1995 年 夏 ，IPNG 工作 组 完成 了 IPv6 的 协议 文本 ; 1995 年 到 1999 年 完成 了 IETF 
要 求 的 协议 审定 和 测试 ，1999 年 成 立 了 IPv6 论坛 ， 开 始 正 式 分 配 卫 v6 地 址 ，IPv6 的 协议 文本 
成 为 标准 草案 。 

IPv6 具有 长 达 128 位 的 地 址 空间 ， 可 以 彻底 解决 IPv4 地 址 不 足 的 问题 。 由 于 IPv4 地 址 是 
32 位 二 进 制 ， 所 能 表示 的 瑟 地 址 个 数 为 22=-4 294 967 296 一 40 亿 个 ， 因 而 在 因特网 上 约 有 40 
亿 个 下 地 址 。 由 32 位 的 IPv4 升级 至 128 位 的 JPv6， 因 特 网 中 的 了 瑟 地 址 从 理论 上 讲 会 有 22s=- 
3.4X10” 个 ， 如 果 整 个 地 球 表面 (包括 陆地 和 水 面 ) 都 覆盖 着 计算 机 ， 那 么 IPv6 允许 每 平方 米 
有 7X10” 个 人 P 地址 ， 如 果 地 址 分 配 的 速率 是 每 秒 分 配 100 万 个 ， 则 需要 1028 年 的 时 间 才 能 将 
所 有 地 址 分 配 完毕 ， 可 见 ， 在 想象 得 到 的 将 来 ，IPv6 的 地 址 空间 是 不 可 能 用 完 的 。 除 此 之 外 ， 
IPv6 还 采用 分 级 地 址 模式 、 高 效 人 P 包 首 部 、 服 务 质 量 、 主 机 地 址 自动 配置 、 认 证 和 加 密 等 许 
多 技术 。 

1) IPv6 数据 包 的 格式 

IPv6 数据 包 有 一 个 40 个 字 节 的 基本 首部 (base header) ， 其 后 允许 有 0 个 或 多 个 扩展 首部 
(Extension Header) ， 再 后 面 是 数据 。 图 10-18 所 示 的 是 IPv6 基本 首部 的 格式 。 每 个 IPv6 数据 
包 都 是 从 基本 首部 开始 。IPv6 基本 首部 的 很 多 字段 可 以 和 IPv4 首部 中 的 字段 直接 对 应 。 

。 版 本 号 : 该 字段 占 4 位 ， 说 明了 下 协议 的 版 本 。 对 于 IPv6 而 言 ， 该 字段 值 是 0110， 

也 就 是 十 进 制 数 的 6。 
。 ”通信 类 型 : 该 字段 占 8 位 , 其 中 优先 级 字段 占 4 位 ,使 源 站 能 够 指明 数据 包 的 流 类 型 。 
首先 ，IPv6 把 流 分 成 两 大 类 ， 即 可 进行 拥塞 控制 的 和 不 可 进行 拥塞 控制 的 。 每 一 类 又 
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分 为 8 个 优先 级 。 优 先 级 的 值 越 大 ,表明 该 分 组 越 重 要 。 对 于 可 进行 拥塞 控制 的 业务 ， 
其 优先 级 为 0 一 7。 当 发 生 拥 塞 时 ， 这 类 数据 包 的 传输 速率 可 以 放 慢 。 对 于 不 可 进行 拥 
塞 控制 的 业务 ， 其 优先 级 为 8 一 15。 这 些 都 是 实时 性 业务 ， 如 音频 或 视频 业务 的 传输 。 
这 种 业务 的 数据 包 发 送 速率 是 恒定 的 ， 即 使 丢掉 了 一 些 ， 也 不 进行 重 发 。 


0 4 12 16 24 31 
1 | 版 本 号 通信 类 型 | 流标 号 
各 净 负 荷 长 度 [下 一个 首部 问 数 归 制 
本 
的 上 128 位 源 地 址 | 
基 上 了 
本 
首 上 上 J 
4 128 位 目的 地 址 | 

4 个 字 节 


图 10-18 IPv6 基本 首部 的 格式 


。 流标 号 : 该 字段 占 20 位 。 所谓 流 , 就 是 因特网 上 从 一 个 特定 源 站 到 一 个 特定 目的 站 ( 单 
播 或 多 播 ) 的 一 系列 数据 包 。 所 有 属于 同一 个 流 的 数据 包 都 具有 同样 的 流标 号 。 源 站 
在 建立 流 时 是 在 224-1 个 流标 号 中 随机 选择 一 个 流标 号 。 流 标号 0 保留 作为 指出 没有 
采用 流标 号 。 源 站 随机 地 选择 流标 号 并 不 会 在 计算 机 之 间 产 生 冲 突 ， 因 为 路 由 器 在 将 
一 个 特定 的 流 与 一 个 数据 包 相 关联 时 使 用 的 是 数据 包 的 源 地 址 和 流标 号 的 组 合 。 

从 一 个 源 站 发 出 的 具有 相同 非 0 流标 号 的 所 有 数据 包 都 必须 具有 相同 的 源 地 址 和 目的 地 
址 ， 以 及 相同 的 逐 跳 选项 首部 〈 若 此 首部 存在 ) 和 路 由 选择 首部 车 此 首部 存在 ) 。 这 样 做 的 
好 处 是 当 路 由 器 处 理 数据 包 时 只 要 查 一 下 流标 号 即 可 ， 而 不 必 查 看 数据 包 首 部 中 的 其 他 内 容 。 
任何 一 个 流标 号 都 不 具有 特定 的 意义 ， 源 站 应 将 它 希望 各 路 由 器 对 其 数据 包 进 行 的 特殊 处 理 写 
明 在 数据 包 的 扩展 首部 中 。 

。 净 负 蓓 长 度 (Payload Length): 该 字段 点 16 位 ， 指 明 除 首部 自身 的 长 度 外 ，IPv6 数据 

包 所 载 的 字 节 数 。 可 见 ， 一 个 IPv6 数据 包 可 容纳 64 千 字 节 长 的 数据 。 由 于 IPv6 的 首 
部 长 度 是 固定 的 ， 因 此 没有 必要 像 IPv4 那样 指明 数据 包 的 总 长 度 〈 首 部 与 数据 部 分 
之 和 )。 

。 下 一 个 首部 (Next Header): 该 字段 占 8 位 , 标识 紧 接 着 IPv6 首部 的 扩展 首部 的 类 型 。 
这 个 字段 指明 在 基本 首部 后 面 紧 接着 的 一 个 首部 的 类 型 。 

。 ” 跳 数 限制 (Hop Limit): 该 字段 占 8 位 ， 用 来 防止 数据 包 在 网 络 中 无 限期 地 存在 。 源 
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站 在 每 个 数据 包 发 出 时 即 设 定 某 个 跳 数 限 制 。 每 一 个 路 由 器 在 转发 数据 包 时 ， 要 先 将 
跳 数 限制 字段 中 的 值 减 1。 当 跳 数 限 制 的 值 为 0 时 , 要 将 此 数据 包 丢弃 。 这 相当 于 IPv4 
首部 中 的 生存 期 字段 ， 但 比 IPv4 中 的 计算 时 间 间 隔 要 简单 一 些 。 

。 源 站 下 地 址 : 该 字段 占 128 位 ， 是 数据 包 的 发 送 站 的 下 地 址 。 

。 目的 站 下 地 址 : 该 字段 占 128 位 ， 是 数据 包 的 接收 站 的 瑟 地 址 。 

2) IPv6 的 地 址 表示 

一 般 来 讲 ， 一 个 IPv6 数据 包 的 目的 地 址 可 以 是 以 下 3 种 基本 类 型 地 址 之 一 。 

。 单 播 (Unicast): 传统 的 点 对 点 通信 。 

。 多 播 (Multicast): 一 点 对 多 点 的 通信 ， 数 据 包 交付 到 一 组 计算 机 中 的 每 一 个 。IPv6 
没有 采用 广播 的 术语 ， 而 是 将 广播 看 作 多 播 的 一 个 特例 。 

。 任 播 (Anycast): 这 是 IPv6 增加 的 一 种 类 型 。 任 播 的 目的 站 是 一 组 计算 机 ， 但 数据 包 
在 交付 时 只 交付 给 其 中 的 一 个 ， 通 常 是 距离 最 近 的 一 个 。 

为 了 使 地 址 的 表示 简洁 一 些 ，IPv6 使 用 冒号 十 六 进 制 记 法 (Colon Hexadecimal Notation， 

Colon Hex) ， 它 把 每 16 位 用 相应 的 十 六 进 制 表示 ， 各 组 之 间 用 冒号 分 隔 。 例 如 : 
686E: 8C64: FFFF: FFFF: 0: 1180: 96A: FFFF 


冒号 十 六 进 制 记 法 允许 0 压缩 (Zero Compression) ， 即 一 连 串 连续 的 0 可 以 用 一 对 冒号 所 
取代 ， 例 如 : 

FF05: 0: 0: 0: 0: 0: 0: B3 ”可 以 改 成 : ”FF05:: B3 

为 了 保证 0 压缩 有 一 个 清晰 的 解释 ， 建 议 中 规定 ， 在 任 一 地 址 中 只 能 使 用 一 次 0 压缩 。 该 
技术 对 已 建议 的 分 配 策略 特别 有 用 ， 因 为 会 有 许多 地 址 包含 连续 的 0 串 。 

另外 ， 冒 号 十 六 进 制 记 法 可 结合 有 点 分 十 进 制 记 法 的 后 级 ， 这 种 结合 在 IPv4 向 IPv6 的 转 
换 阶段 特别 有 用 。 例 如 ， 下 面 的 串 是 一 个 合法 的 冒号 十 六 进 制 记 法 : 


0: 0: 0: 0: 0: 0: 128.10.1.1 


请 注意 ， 在 这 种 记 法 中 ， 虽 然 为 冒号 所 分 隔 的 每 个 值 是 一 个 16 位 的 量 ， 但 每 个 点 分 十 进 
制 部 分 的 值 指明 一 个 字 节 的 值 。 再 使 用 0 压缩 即 可 得 出 : 


: 128.10.1.1 


10.4.3 Internet 服务 
作为 全 世界 最 天 的 国际 性 计算 机 网 络 的 Intemet， 为 全 球 的 科研 界 、 教 育 界 和 娱乐 界 等 方 
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面 提供 了 极其 丰富 的 信息 资源 和 最 先进 的 信息 交流 手段 。 在 Intemet 上 ， 时 刻 传送 着 大 量 的 各 
种 各 样 的 信息 ， 从 电影 、 实 况 转播 到 最 尖端 的 科学 研究 等 无 所 不 包 ， 当 然 信 息 最 多 的 还 是 科技 
信息 ， 如 计算 机 软件 、 科 技 论 文 、 图 书馆 /出 版 社 目录 、 最 新 科技 动态 、 电 子 杂 志 、 产 品 推销 和 
网 络 新 闻 等 。 这 些 内 容 均 可 由 Intemet 服务 来 为 用 户 提供 。 

在 使 用 传输 控制 协议 或 用 户 数据 报 协议 时 ，Intemet IP 可 支持 65 535 种 服务 ， 这 些 服务 是 
通过 各 个 端口 到 名 字 实 现 的 逻辑 连接 。 端 口 分 两 类 : 一 类 是 已 知 端口 或 称 公 认 端 口 ， 端 口号 为 
0 一 1023， 这 些 端 口 由 Intemet 赋值 地 址 和 端口 号 的 组 织 (IANA) 赋值 ， 另 一 类 是 需 在 IANA 
注册 登记 的 端口 号 ， 为 1024 一 65 535。 

前 面 介 绍 了 Internet 网 络 接口 层 、 网 际 层 协议 和 传输 层 协议 , 本 节 主 要 介绍 Internet 的 高 层 
协议 ， 如 域名 服务 、 远 程 登录 服务 、 电 子 邮件 服务 、WWW 服务 和 文件 传输 服务 等 。 


1， 域名 服务 


Intemet 中 的 域名 地 址 和 他 地 址 是 等 价 的 ， 它 们 之 间 是 通过 域名 服务 来 完成 映射 变换 的 。 
实际 上 ，DNS 是 一 种 分 布 式 地 址 信息 数据 库 系 统 ， 服 务 器 中 包含 整个 数据 库 的 某 部 分 信息 ， 并 
供 客户 查询 。DNS 允许 局 部 控制 整个 数据 库 的 某 些 部 分 , 但 数据 库 的 每 一 部 分 都 可 通过 全 网 查 
询 得 到 。 

域名 系统 采用 的 是 客户 端 /服务 器 模式 , 整个 系统 由 解析 器 和 域名 服务 器 组 成 。 解析 器 是 客 
户 方 ， 它 负责 查询 域名 服务 器 、 解 释 从 服务 器 返回 来 的 应 答 、 将 信息 返回 给 请 求 方 等 工作 。 域 
名 服务 器 是 服务 器 方 ， 它 通常 保存 着 一 部 分 域名 空间 的 全 部 信息 ， 这 部 分 域名 空间 称 为 区 
(Zone)。 一 个 域名 服务 器 可 以 管理 一 个 或 多 个 区 。 域名 服务 器 可 以 分 为 主 服 务 器 、Caching Only 
服务 器 和 转发 服务 器 (Forwarding Server)。 

域名 系统 是 一 个 分 布 式 系统 ， 其 管理 和 控制 也 是 分 布 式 的。 一 个 用 户 A 在 查找 另 一 用 户 B 
时 ， 域 名 系统 的 工作 过 程 如 下 。 

(1) 解析 器 向 本 地 域名 服务 器 发 出 请 求 查 阅 用 户 B 的 域名 。 

(2) 本 地 域名 服务 器 向 最 高 层 域名 服务 器 发 出 查询 地 址 的 请 求 。 

(3) 最 高 层 域名 服务 器 返回 给 本 地 域名 服务 器 一 个 他 地 址 。 

(4) 本 地 域名 服务 器 向 组 域名 服务 器 发 出 查询 地 址 的 请 求 。 

(5) 组 域名 服务 器 返回 给 本 地 域名 服务 器 一 个 他 地 址 。 

(6) 本 地 服务 器 向 刚 返回 的 域名 服务 器 发 出 查询 域名 地 址 请 求 。 

(7) 人 P 地 址 返回 给 本 地 域名 服务 器 。 

(8) 本 地 域名 服务 器 将 该 地 址 返回 给 解析 器 。 

因此 ， 本 地 域名 服务 器 为 了 得 到 一 个 下 地 址 常常 需要 查询 多 个 域名 服务 器 。 于 是 ， 在 查询 
地 址 的 同时 ， 本 地 域名 服务 器 也 就 得 到 了 许多 其 他 域名 服务 器 的 信息 ， 像 它们 的 中 地址、 所 负 
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责 的 区 域 等 。 本 地 域名 服务 器 将 这 些 信息 连同 最 终 查 询 到 的 主机 人 P 地 址 全 部 存放 在 它 的 Cache 
中 ， 以 便 将 来 参考 。 当 下 次 解析 器 再 查询 与 这 些 域名 相关 的 信息 时 ， 就 可 以 直接 引用 ， 这 样 大 
大 减少 了 查询 时 间 。 

因此 ， 在 访问 主机 的 时 候 只 需要 知道 域名 ， 通 过 DNS 服务 器 将 域名 变换 为 人 P 地 址 。DNS 
所 用 的 是 UDP 端口 ， 端 口号 为 53。 


2. 远程 登录 服务 


远程 登录 服务 是 在 Telnet 协议 的 支持 下 ， 将 用 户 计算 机 与 远程 主机 连接 起 来 ， 在 远程 计算 
机 上 运行 程序 ， 将 相应 的 屏幕 显示 传送 到 本 地 机 器 ， 并 将 本 地 的 输入 送 给 远程 计算 机 。 由 于 这 
种 服务 基于 Telnet 协议 且 使 用 Telnet 命令 进行 远程 登录 ， 故 称 为 Telnet 远程 登录 。 

Telnet 是 基于 客户 端 /服务 器 模式 的 服务 系统 ， 它 由 客户 端 软件 、 服 务 器 软件 以 及 Telnet 通 
信 协 议 三 部 分 组 成 。 远 程 计算 机 又 称 为 Telnet 主机 或 服务 器 ， 本 地 计算 机 作为 Telnet 客户 端 来 
使 用 ， 它 起 到 远程 主机 的 一 台 虚 拟 终端 〈 仿 真 终端 ) 的 作用 ， 通 过 它 用 户 可 以 与 主机 上 的 其 他 
用 户 一 样 共同 使 用 该 主机 提供 的 服务 和 资源 。 

当 用 户 使 用 Telnet 登录 远程 主机 时 ,该 用 户 必 须 在 这 个 远程 主机 上 拥有 合法 的 账号 和 相应 
的 密码 ， 否 则 远程 主机 将 会 拒绝 登录 。 在 运行 Telnet 客户 程序 后 ， 首 先 应 该 建立 与 远程 主机 的 
TCP 连接 ， 从 技术 上 讲 ， 就 是 在 一 个 特定 的 TCP 端口 (端口 号 一 般 为 23) 上 打开 一 个 套 接 字 ， 
如 果 远 程 主机 上 的 服务 器 软件 一 直 在 这 个 众所周知 的 端口 上 侦 听 连接 请 求 ， 则 这 个 连接 便 会 建 
立 起 来 ， 此 时 用 户 的 计算 机 就 成 为 该 远程 主机 的 一 个 终端 ， 便 可 以 进行 联机 操作 了 ， 即 以 终端 
方式 为 用 户 提供 人 机 界面 。 然 后 将 用 户 输入 的 信息 通过 Telnet 协议 便 可 以 传送 给 远程 主机 ， 主 
机 在 众所周知 的 TCP 端口 上 侦 听 到 用 户 的 请 求 并 处 理 后 , 将 处 理 的 结果 通过 Telnet 协议 返回 给 
客户 程序 。 最 后 客户 端 接收 到 远程 主机 发 送 来 的 信息 ， 并 经 过 适当 的 转换 显示 在 用 户 计 算 机 的 
屏幕 上 。 

3. 电子 邮件 服务 


电子 邮件 〈E-mail) 就 是 利用 计算 机 进行 信息 交换 的 电子 媒体 信件 。 它 是 随 着 计算 机 网 络 
而 出 现 的 ， 并 依靠 网 络 的 通信 手段 实现 普通 邮件 信息 的 传输 。 它 是 最 广泛 的 一 种 服务 。 

电子 邮件 是 一 种 通过 计算 机 网 络 与 其 他 用 户 进行 联系 的 快速 、 简 便 、 高 效 、 价 廉 的 现代 化 
通信 手段 。 如 果 要 使 用 E-mail， 首 先 必须 拥有 一 个 电子 邮箱 ， 它 是 由 E-mail 服务 提供 者 为 其 用 
户 建立 在 E-mail 服务 器 磁盘 上 的 专用 于 存放 电子 邮件 的 存储 区 域 ,并 由 E-mail 服务 器 进行 管理 。 
用 户 将 使 用 E-mail 客户 软件 在 自己 的 电子 邮箱 里 收发 电子 邮件 。 电子 邮件 地 址 的 一 般 格 式 为 用 
户 名 @ 主 机 名 ， 例 如 fqzhang@china.com。 

E-mail 系统 基于 客户 端 /服务 器 模式 ， 整 个 系统 由 E-mail 客户 端 软件 、E-mail 服务 器 和 通 
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信 协 议 三 部 分 组 成 。 E-mail 客户 端 软 件 也 称 用 户 代理 (User Agent)， 它 是 用 户 用 来 收发 和 管理 
电子 邮件 的 工具 ; E-mail 服务 器 主要 充当 “邮局 ”的 角色 ， 它 除了 为 用 户 提供 电子 邮箱 外 ， 还 
承担 着 信件 的 投递 业务 ， 当 用 户 发 送 一 个 电子 邮件 后 ，E-mail 服务 器 通过 网 络 若干 中 间 结 点 的 
“存储 一 转发 ” 式 的 传递 ， 最 终 把 信件 投递 到 目的 地 〈 收 信人 的 电子 邮箱 );，E-mail 服务 器 主要 
采用 SMTP (简单 邮件 传输 协议 )， 本 协议 描述 了 电子 邮件 的 信息 格式 及 其 传递 处 理 方法 ， 保 证 
被 传送 的 电子 邮件 能 够 正确 的 寻 址 和 可 靠 的 传输 ， 它 是 面向 文本 的 网 络 协议 ， 其 缺点 是 不 能 用 
来 传送 非 ASCII 码 文本 和 非 文字 性 附件 ,在 日 益 发 展 的 多 媒体 环境 中 以 及 人 们 关注 的 邮件 私密 
性 方面 更 显 出 它 的 局 限 性 。 后 来 的 一 些 协议 ， 包 括 多 用 途 Intemet 邮件 扩充 协议 (MIME) 及 增 
强 私密 邮件 保护 协议 (PEM)， 弥 补 了 SMTP 的 缺点 。SMTP 用 在 大 型 多 用 户 、 多 任务 的 操作 
系统 环境 中 ,将 它 用 在 PC 上 收 信和 是 十 分 困难 的 ， 所 以 在 TCP/IP 网 络 上 的 大 多 数 邮 件 管理 程序 
使 用 SMTP 来 发 信 ， 且 采用 POP (Post Office Protocol， 常 用 的 是 POP3) 来 保管 用 户 未 能 及 时 
取 走 的 邮件 。 

POP 协议 有 两 个 版 本 : POP2 和 POP3。 目 前 使 用 的 POP3 既 能 与 STMP 共同 使 用 ， 也 可 以 
单独 使 用 , 以 传送 和 接收 电子 邮件 .POP 协议 是 一 种 简单 的 纯 文本 协议 , 每 次 传输 以 整个 E-mail 
为 单位 ， 不 能 提供 部 分 传输 。 

用 户 要 传送 E-mail， 首先 需 在 联网 的 计算 机 上 使 用 邮件 软件 编 好 邮件 正文 ， 填 好 邮件 收 信 
人 的 E-mail 地 址 、 发 信人 电子 邮件 地 址 (或 自动 填 上 )、 邮 件 的 主题 等 内 容 ， 然 后 使 用 E-mail 
的 发 送 命令 发 出 。 此 时 ，E-mail 发 送 端 与 接收 端的 计算 机 在 工作 时 并 不 直接 进行 通信 ， 而 是 在 
发 信 端 计算 机 送出 邮件 后 ， 先 到 达 自 己 所 注册 的 邮件 服务 器 主机 ， 再 在 网 络 传输 过 程 中 经 过 多 
个 计算 机 和 路 由 器 的 中 转 到 达 目 的 地 的 邮件 服务 器 主机 ， 送 进 收 信人 的 电子 邮箱 ， 最 后 邮件 的 
接收 者 上 网 并 启动 电子 邮件 管理 程序 ， 它 就 会 自动 检查 邮件 服务 器 中 的 电子 邮箱 ， 若 发 现 新 邮 
件 ， 便 会 下 载 到 自己 的 计算 机 上 ， 完 成 接收 邮件 的 任务 。 

简单 邮件 传送 协议 和 用 于 接收 邮件 的 POP3 均 是 利用 TCP 端 口 .SMTP 所 用 的 端口 号 是 25， 
POP3 所 用 的 端口 号 是 110。 


4. WWW (World Wide Web， 万 维 网 ) 服务 


万 维 网 是 一 种 交互 式 图 形 界面 的 Internet 服务 ， 具 有 强大 的 信息 连接 功能 ， 是 目前 Intermet 
中 最 受 欢迎 的 、 增 长 速度 最 快 的 一 种 多 媒体 信息 服务 系统 。 

万 维 网 是 基于 客户 端 / 服 务 器 模式 的 信息 发 送 技术 和 超 文 本 技术 的 综合 ，WWW 服务 器 把 
信息 组 织 为 分 布 的 超 文 本 ， 这 些 信息 结 点 可 以 是 文本 、 子 目录 或 信息 指针 。WWW 浏览 程序 为 
用 户 提供 基于 超 文本 传输 协议 (Hyper Text Transfer Protocol，HTTP) 的 用 户 界面 ，，WWW 服务 
器 的 数据 文件 由 超 文 本 标记 语言 (Hyper Text Markup Language，HTML) 描述 ，HTML 利用 统 
一 资源 定位 器 (URL) 的 指标 是 超 媒体 链接 ， 并 在 文本 内 指向 其 他 网 络 资源 。 
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超 文本 传输 协议 是 一 个 Intemet 上 的 应 用 层 协 议 ， 是 Web 服务 器 和 Web 浏览 器 之 间 进 行 
通信 的 语言 。 所 有 的 Web 服务 器 和 Web 浏览 器 必须 遵循 这 一 协议 ， 才 能 发 送 或 接收 超 文本 文 
件 .HITP 是 客户 端 /服务 器 体系 结构 , 提供 信息 资源 的 Web 结 点 ( 即 Web 服务 器 ), 可 称 为 HITP 
服务 器 ，Web 浏览 器 则 是 HTTP 服务 器 的 客户 。WWW 上 的 信息 检索 服务 系统 就 是 遵循 HITP 
运行 的 。 在 HITP 的 帮助 下 ， 用 户 可 以 只 关心 要 检索 的 信息 ， 而 无 须 考虑 这 些 信 息 存储 在 什么 
地 方 。 

在 Internet 上 ， 万维网 整个 系统 由 Web 服务 器 、Web 浏览 器 (Browser) 和 HTTP 通信 协 
议 三 部 分 组 成 。Web 服务 器 提供 信息 资源 ，Web 浏览 器 将 信息 显示 出 来 :，HTTP 是 为 分 布 式 超 
媒体 信息 系统 设计 的 一 种 网 络 协议 ， 主 要 用 于 域名 服务 器 和 分 布 式 对 象 管理 ， 它 能 够 传送 任意 
类 型 的 数据 对 象 ， 以 满足 Web 服务 器 与 客户 端 之 间 多 媒体 通信 的 需要 ， 从 而 成 为 Internet 中 发 
布 多 媒体 信息 的 主要 协议 。 

统一 资源 定位 器 是 在 WWW 中 标识 某 一 特定 信息 资源 所 在 位 置 的 字符 串 ， 是 一 个 具有 指针 
作用 的 地 址 标准 。 在 WWW 上 查询 信息 ， 必 不 可 少 的 一 项 操作 是 在 浏览 器 中 输入 查询 目标 的 地 
址 ， 这 个 地 址 就 是 URL， 也 称 Web 地 址 ， 俗 称 “网 址 ” 一 个 URL 指定 一 个 远程 服务 器 域名 
和 一 个 Web 页 。 换 而 言 之 , 每 个 Web 页 都 有 了 唯一 的 URL。URL 也 可 指向 FTP、WAIS 和 gopher 
服务 器 代表 的 信息 。 通 常 ， 用 户 只 需要 了 解 和 使 用 主页 的 URL， 通 过 主页 再 访问 其 他 页 。 当 用 
户 通过 URL 向 WWW 提出 访问 某 种 信息 资源 时 ，WWW 的 客户 服务 器 程序 自动 查找 资源 所 在 
的 服务 器 地 址 ， 一 旦 找到 ， 立 即将 资源 调 出 供用 户 浏览 。 

使 用 WWW 的 浏览 程序 (例如 Intemet Explore、Netscape 和 Mosaic 等 )， 网 页 的 超 文本 链 
接 将 引导 用 户 找到 所 需要 的 信息 资源 。 

如 果 已 经 是 Internet 的 用 户 ， 只 要 在 自己 的 计算 机 上 运行 一 个 客户 程序 (WWW 浏览 器 )， 
并 给 出 需 访问 的 URL 地 址 , 就 可 以 尽情 浏览 这 些 来 自 远方 或 近邻 的 各 种 信息 。- WWW 工作 过 程 为 : 
首先 通过 局 域 网 或 通过 电话 拨号 连 入 Intemet， 并 在 本 地 计算 机 上 运行 WWW 浏览 器 程序 ， 然 
后 根据 想 要 获得 的 信息 来 源 在 浏览 器 的 指定 位 置 输入 WWW 地址 ， 并 通过 浏览 器 向 Intermet 发 
出 请 求 信息 ， 此 时 网 络 中 的 人 P 路 由 器 和 服务 器 将 按照 地 址 把 信息 传递 到 所 要 求 的 WWW 服务 
器 中 ， 而 WWW 服务 器 不 断 在 一 个 众所周知 的 TCP 端口 (端口 号 为 80) 上 侦 听 用 户 的 连接 请 
求 , 当 服务 器 接收 到 请 求 后 , 找到 所 要 求 的 WWW 页 面 , 最 后 服务 器 将 找到 的 页 面 通过 Intemet 
传送 回 用 户 的 计算 机 ， 浏 览 器 接收 传 来 的 超 文 本 文件 ， 转 换 并 显示 在 计算 机 屏幕 上 。 

一 个 URL (Web 地 址 ) 包括 以 下 儿 部 分 : 协议 、 主 机 域名 、 端 口号 ( 任 选 )、 目 录 路 径 ( 任 
选 ) 和 一 个 文件 名 ( 任 选 )。 其 格式 为 : 


scheme://host.Domain[: port]JUpath/filename ] 


其 中 ，scheme 指定 服务 连接 的 方式 (协议 )， 通 常 有 下 列 几 种 。 
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。 ”file: 本 地 计算 机 上 的 文件 。 

。 ”ftp: FTP 服务 器 上 的 文件 。 

。 ”gopher: Gopher 服务 器 上 的 文件 。 

。 http: WWW 服务 器 上 的 超 文本 文件 。 

。 New: 一 个 USenet 的 新 闻 组 。 

。 ”telnet: 一 个 Telnet 站 点 。 

。 ”wais: 一 个 WAIS 服务 器 。 

。 mailto: 发 送 邮件 给 某 人 。 

在 地 址 的 冒号 之 后 通常 是 两 个 反 斜 线 ， 表 示 后 面 是 指定 信息 资源 的 位 置 ， 其 后 是 一 个 可 选 
的 端口 号 ， 地 址 的 最 后 部 分 是 路 径 或 文件 名 。 如 果 端 口号 默认 ， 表 示 使 用 与 某 种 服务 方式 对 应 
的 标准 端口 号 。 根 据 查询 要 求 不 同 ， 给 出 的 URL 中 的 目录 路 径 这 一 项 可 有 可 无 。 如 果 在 查询 中 要 
求 包括 文件 路 径 ， 那 么 在 URL 中 就 要 具体 指出 要 访问 的 文件 名 称 。 

下 面 是 一 些 URL 的 例子 : 


http://www.cctv.com/ 中 国 中 央 电 视 台 网 址 
http://www.xjtu.edu.cn/ 西安 交通 大 学 网 址 
ftp://ftp.xjtu.edu.cn/ 西安 交通 大 学 文件 服务 器 


gopher://gopher.xjtu.edu.cn ”西安 交通 大 学 Gopher 服务 器 
5. 文件 传输 服务 


文件 传输 协议 用 来 在 计算 机 之 间 传 输 文件 。 由 于 Intemet 是 一 座 装 满 了 各 种 计算 机 文件 的 
宝库 ， 其 中 有 免费 和 共享 的 软件 、 各 种 图 片 、 声 音 、 图 像 和 动画 文件 ， 还 有 书籍 和 参考 资料 等 ， 
如 果 希 望 将 它们 下 载 到 你 的 计算 机 上 ， 最 主要 的 一 个 方法 是 通过 文件 传输 协议 来 实现 ， 因 此 它 
是 Intemet 中 广 为 使 用 的 一 种 服务 。 

通常 ,一 个 用 户 需 要 在 FTP 服务 器 中 进行 注册 ， 即 建立 用 户 账号 ,在 拥有 合法 的 登录 用 户 
名 和 密码 后 ， 才 有 可 能 进行 有 效 的 FTP 连接 和 登录 。 对 于 Internet 中 成 千 上 万 个 FTP 服务 器 来 
说 , 这 就 给 提供 FTP 服务 的 管理 员 带 来 很 大 的 麻烦 , 即 需要 为 每 一 个 使 用 FTP 的 用 户 提供 一 个 
账号 ， 这 样 做 显然 是 不 现实 的 。 实 际 上 ，Internet 的 FTP 服务 是 一 种 匿名 (anonymous) FTP 服 
务 ， 它 设置 了 一 个 特殊 的 用 户 名 一 一 anonymous， 供 公众 使 用 ， 任 何 用 户 都 可 以 使 用 这 个 用 户 
名 与 提供 这 种 匿名 FTP 服务 的 主机 建立 连接 ， 并 共享 这 个 主机 对 公众 开放 的 资源 。 

匿名 FTP 的 用 户 名 是 anonymous， 密 码 通常 是 guest 或 者 是 使 用 者 的 E-mail 地 址 。 当 用 户 
登录 到 匿名 FTP 服务 器 后 ， 其 工作 方式 与 常规 FTP 相同。 通常 ， 出 于 安全 的 目的 ， 大 多 数 匿 名 
FTP 服务 器 只 允许 下 载 (Download) 文件 ， 而 不 允许 上 传 (Upload) 文件 。 也 就 是 说 ， 用 户 只 


so 
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E 从 匿名 FTP 服务 器 复制 所 需 的 文件 ， 而 不 能 将 文件 复制 到 匿名 FTP 服务 器 上 。 此 外 ， 匿 名 
FTP 服务 器 中 的 文件 还 加 入 一 些 保护 性 措施 ， 确 保 这 些 文件 不 能 被 修改 和 删除 ， 同 时 也 可 以 防 
止 计算 机 病毒 的 侵入 。 

FTP 是 基于 客户 端 /服务 器 模式 的 服务 系统 ， 它 由 客户 端 软件 、 服 务 器 软件 和 FTP 通信 协 
议 3 个 部 分 组 成 。FTP 客户 端 软件 运行 在 用 户 计算 机 上 ， 在 用 户 装 入 FTP 客户 端 软件 后 ， 便 可 
以 通过 使 用 FTP 内 部 命令 与 远程 FTP 服务 器 采用 FTP 通信 协议 建立 连接 或 文件 传送 ， FTP 服 
务 器 软件 运行 在 远程 主机 上 ， 并 设置 一 个 名 叫 anonymous 的 公共 用 户 账号 ， 向 公众 开放 。 

FTP 在 客户 端 与 服务 器 的 内 部 建立 两 条 TCP 连接 : 一 条 是 控制 连接 , 主要 用 于 传输 命令 和 
参数 (端口 号 为 21); 另 一 条 是 数据 连接 ， 主 要 用 于 传送 文件 〈 端 口号 为 20)。FTP 服务 器 不 
断 地 在 21 号 端口 上 侦 听 用 户 的 连接 请 求 ,， 当 用 户 使 用 用 户 名 anonymous 和 密码 guest 或 者 用 户 
E-mail 地 址 进行 登录 时 ， 用 户 即 发 出 连接 请 求 ， 这 样 控制 连接 便 建 立 起 来 。 此 时 ， 用 户 名 和 密 
码 将 通过 控制 连接 发 送 给 服务 器 ， 服务 器 接收 到 这 个 请 求 后 ， 便 进行 用 户 识别 ， 然 后 向 客户 回 
送 确认 或 拒绝 的 应 答 信息 用户 看 到 登录 成 功 的 信息 后 ， 便 可 以 发 出 文件 传输 的 命令 ， 服 务 器 
从 控制 连接 上 接收 到 文件 名 和 传输 命令 (如 get) 后 ， 便 在 20 号 端口 发 起 数据 连接 ， 并 在 这 个 
连接 上 将 文件 名 所 指明 的 文件 传输 给 客户 。 只 要 用 户 不 使 用 close 或 者 其 他 命令 关闭 连接 ， 便 
可 以 继续 传输 其 他 文件 。 


10.5 ”信息 安全 基础 知识 


信息 成 为 一 种 重要 的 战略 资源 ， 信 息 的 获取 、 处 理 和 安全 保障 能 力 成 为 一 个 国家 综合 国力 
的 重要 组 成 部 分 ， 信 息 安全 事 关 国家 安全 、 事 关 社 会 稳定 。 信 息 安全 理论 与 技术 的 内 容 十 分 广 
泛 ， 包 括 密 码 学 与 信息 加 密 、 可 信 计 算 、 网 络 安全 和 信息 隐藏 等 多 个 方面 。 


1. 信息 安全 存储 安全 


信息 安全 包括 5 个 基本 要 素 : 机 密 性 、 完 整 性 、 可 用 性 、 可 控 性 与 可 审查 性 。 

。 ”机 密 性 : 确保 信息 不 暴露 给 未 授权 的 实体 或 进程 。 

。 ”完整 性 ， 只 有 得 到 允许 的 人 才能 修改 数据 ， 并 且 能 够 判别 出 数据 是 否 已 被 算 改 。 

。 ”可 用 性 : 得 到 授权 的 实体 在 需要 时 可 访问 数据 ， 即 攻击 者 不 能 占用 所 有 的 资源 而 阻碍 
授权 者 的 工作 。 

。 ”可 控 性 : 可 以 控制 授权 范围 内 的 信息 流向 及 行为 方式 。 

。 ”可 审查 性 : 对 出 现 的 信息 安全 问题 提供 调查 的 依据 和 手段 。 

信息 的 存储 安全 包括 信息 使 用 的 安全 〈 如 用 户 的 标识 与 验证 、 用 户 存 取 权限 限制 、 安 全 问 
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题 跟 踪 等 )、 系 统 安全 监控 、 计 算 机 病毒 防治 、 数 据 的 加 密 和 防止 非法 的 攻击 等 。 

1) 用 户 的 标识 与 验证 

用 户 的 标识 与 验证 主要 是 限制 访问 系统 的 人 员 。 它 是 访问 控制 的 基础 ， 是 对 用 户 身份 的 合 
法 性 验证 。 方 法 有 如 下 两 种 : 

一 是 基于 人 的 物理 特征 的 识别 ， 包 括 签名 识别 法 、 指 纹 识 别 法 和 语音 识别 法 ; 

二 是 基于 用 户 所 拥有 特殊 安全 物品 的 识别 ， 包 括 智能 IC 卡 识别 法 、 磁 条 卡 识别 法 。 

2) 用 户 存 取 权 限 限 制 

用 户 存 取 权 限 限制 主要 是 限制 进入 系统 的 用 户 所 能 做 的 操作 。 存 取 控 制 是 对 所 有 的 直接 存 
取 活动 通 过 授权 进行 控制 以 保证 计算 机 系统 安全 保密 机 制 ， 是 对 处 理 状态 下 的 信息 进行 保护 。 
一 般 有 两 种 方法 : 隔离 控制 法 和 限制 权限 法 。 

(1) 隔离 控制 法 。 隔 离 控制 法 是 在 电子 数据 处 理 成 分 的 周围 建立 屏障 ， 以 便 在 该 环境 中 实 
施 存 取 规 则 。 隔 离 控制 技术 的 主要 实现 方式 包括 物理 隔离 方式 、 时 间隔 离 方 式 、 罗 辑 隔离 方式 
和 密码 技术 隔离 方式 等 。 其 中 ， 物 理 隔 离 方式 的 各 过 程 使 用 不 同 的 物理 目标 ， 是 一 种 有 效 的 方 
式 。 传 统 的 多 网 环境 一 般 通 过 运行 两 台 计 算 机 实现 物理 隔离 。 现 在 我 国 已 经 生产 出 了 拥有 自主 
知识 产权 的 涉 密 计算 机 ， 它 采用 双 硬 盘 物 理 隔 离 技 术 ， 通 过 运行 一 台 计 算 机 ， 即 可 在 物理 隔离 
的 状态 下 切换 信息 网 和 公共 信息 网 ， 实 现 一 机 双 网 或 一 机 多 网 的 功能 。 还 有 另外 一 种 方式 就 是 
加 装 隔离 卡 ， 一 块 隔离 卡带 一 块 硬盘 、 一 块 网 卡 ， 连 同 本 机 自 带 的 硬盘 网 卡 ， 使 用 不 同 的 网 络 
环境 。 当 然 ， 物 理 隔离 方式 对 于 系统 的 要 求 比较 高 ， 必 须 采 用 两 套 互 不 相关 的 设备 ， 其 人 力 、 
物力 、 财 力 的 投入 都 是 比较 大 的 。 但 它 也 是 很 有 效 的 方式 ， 因 为 两 者 就 如 两 条 平行 线 ， 永 不 交 
又 ， 自 然 也 就 安全 了 。 

(2) 限制 权限 法 。 限 制 权限 法 是 有 效 地 限制 进入 系统 的 用 户 所 进行 的 操作 。 即 对 用 户 进行 
分 类 管理 ， 安 全 密级 、 授 权 不 同 的 用 户 分 在 不 同类 别 ， 对 目录 、 文 件 的 访问 控制 进行 严格 的 权 
限 控制 ， 防 止 越权 操作 ;放置 在 临时 目录 或 通信 缓冲 区 的 文件 要 加 密 ， 用 完 尽快 移 走 或 删除 。 

3) 系统 安全 监控 

系统 必须 建立 一 套 安全 监控 系统 ， 全 面 监控 系统 的 活动 ， 并 随时 检查 系统 的 使 用 情况 ， 一 
旦 有 非法 入 侵 者 进入 系统 ， 能 及 时 发 现 并 采取 相应 措施 ， 确 定 和 堵塞 安全 及 保密 的 漏洞 。 应 当 
建立 完善 的 审计 系统 和 日 志 管理 系统 ， 利 用 日 志和 审计 功能 对 系统 进行 安全 监控 。 管 理 员 还 应 
该 经 常 做 以 下 方面 。 

(1) 监控 当前 正在 进行 的 进程 ， 正 在 登录 的 用 户 情况 。 

(2) 检查 文件 的 所 有 者 、 授 权 、 修 改 日 期 情况 和 文件 的 特定 访问 控制 属性 。 

(3) 检查 系统 命令 安全 配置 文件 、 口 令 文件 、 核 心 启动 运行 文件 、 任 何 可 执行 文件 的 修改 
情况 。 

(4) 检查 用 户 登 录 的 历史 记录 和 超级 用 户 登录 的 记录 。 如 发 现 异常 ， 及 时 处 理 。 


ses 
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4) 计算 机 病毒 防治 

计算 机 网 络 服务 器 必须 加 装 网 络 病毒 自动 检测 系统 ， 以 保护 网 络 系统 的 安全 ， 防 范 计算 机 
病毒 的 侵袭 ， 并 且 必须 定期 更 新 网 络 病毒 检测 系统 。 

由 于 计算 机 病毒 具有 隐蔽 性 、 传 染 性 、 潜 伏 性 、 触 发 性 和 破坏 性 等 特点 ， 所 以 需要 建立 计 
算 机 病毒 防治 管理 制度 。 

(1) 经 常 从 软件 供应 商 网 站 下 载 、 安 装 安全 补丁 程序 和 升级 杀毒 软件 。 

(2) 定期 检查 敏感 文件 。 对 系统 的 一 些 敏感 文件 定期 进行 检查 ， 以 保证 及 时 发 现 已 感染 的 
病毒 和 黑客 程序 。 

(3) 使 用 高 强度 的 口令 。 尽 量 选择 难以 猜测 的 口令 ， 对 不 同 的 账号 选用 不 同 的 口令 。 

(4) 经 常备 份 重要 数据 ， 要 做 到 每 天 坚持 备份 。 

(5) 选择 、 安 装 经 过 公安 部 认证 的 防 病毒 软件 ， 定 期 对 整个 硬盘 进行 病毒 检测 、 清 除 工作 。 

(6) 可 以 在 计算 机 和 因特网 之 间 安 装 使 用 防火 墙 ， 提 高 系统 的 安全 性 。 

(7) 当 计算 机 不 使 用 时 ， 不 要 接 入 因特网 ， 一 定 要 断 掉 连 接 。 

(8) 重要 的 计算 机 系统 和 网 络 一 定 要 严格 与 因特网 物理 隔离 。 

(9) 不 要 打开 陌生 人 发 来 的 电子 邮件 ， 无 论 它们 有 和 多么 诱 人 的 标题 或 者 附件 ， 同 时 要 小 心 
处 理 来 自 于 熟人 的 邮件 附件 。 

(10) 正确 配置 系统 和 使 用 病毒 防治 产品 。 正 确 配 置 系统 ， 充 分 利用 系统 提供 的 安全 机 制 ， 
提高 系统 防范 病毒 的 能 力 ， 减 少 病毒 侵害 事件 。 了 解 所 选用 防 病毒 产品 的 技术 特点 ， 正 确 配 置 
以 保护 自身 系统 的 安全 。 


2. 计算 机 信息 系统 安全 保护 等 级 


1999 年 2 月 9 日 , 为 更 好 地 与 国际 接轨 , 经 国家 质量 技术 监督 局 批准 ， 正 式 成 立 了 “中 国 
国家 信息 安全 测评 认证 中 心 (China National Information Security Testing Evaluation Certification 
Center, CNISTEC)”。1994 年 , 国务 院 发 布 了 《中 华人 民 共 和 国 计 算 机 信息 系统 安全 保护 条 例 》， 
该 条 例 是 计算 机 信息 系统 安全 保护 的 法 律 基础 。 其 中 第 九条 规定 “计算 机 信息 系统 实行 安全 等 
级 保护 。 安 全 等 级 的 划分 和 安全 等 级 的 保护 的 具体 办 法 ， 由 公安 部 会 同 有 关 部 门 制定 。” 公 安 
部 在 《条 例 》 发 布 实施 后 组 织 制订 了 《计算 机 信息 系统 安全 保护 等 级 划分 准则 》(GB 17859 一 
1999)， 并 于 1999 年 9 月 13 日 由 国家 质量 技术 监督 局 审查 通过 并 正式 批准 发 布 ， 已 于 2001 年 
1 月 1 日 起 执行 。 该 准则 的 发 布 为 我 国 计 算 机 信息 系统 安全 法 规 和 配套 标准 制定 的 执法 部 门 的 
监督 检查 提供 了 依据 ， 为 安全 产品 的 研制 提供 了 技术 支持 ， 为 安全 系统 的 建设 和 管理 提供 了 技 
术 指导 ， 是 我 国 计 算 机 信息 系统 安全 保护 等 级 工作 的 基础 。 本 标准 规定 了 计算 机 系统 安全 保护 
能 力 的 5 个 等 级 。 

(1) 第 一 级 : 用 户 自主 保护 级 〈 对 应 TCSEC 的 Cl 级 )。 本 级 的 计算 机 信息 系统 可 信 计 算 


第 10 章 ”网络 与 信息 安全 基础 知识 


基 (Trusted Computing Base) 通过 隔离 用 户 与 数据 ， 使 用 户 具 备 自主 安全 保护 的 能 力 。 它 具有 
多 种 形式 的 控制 能 力 ， 对 用 户 实施 访问 控制 ， 即 为 用 户 提供 可 行 的 手段 ， 保 护 用 户 和 用 户 组 信 
息 ， 避 免 其 他 用 户 对 数据 的 非法 读 写 与 破坏 。 

(2) 第 二 级 : 系统 审计 保护 级 (对 应 TCSEC 的 C2 级 )。 与 用 户 自主 保护 级 相 比 ， 本 级 的 
计算 机 信息 系统 可 信 计 算 机 实施 了 粒度 更 细 的 自主 访问 控制 ， 它 通过 登录 规程 、 审 计 安全 性 相 
关 事件 和 隔离 资源 ， 使 用 户 对 自己 的 行为 负责 。 

(3) 第 三 级 : 安全 标记 保护 级 (对 应 TCSEC 的 B1 级 )。 本 级 的 计算 机 信息 系统 可 信 计 算 
基 具 有 系统 审计 保护 级 所 有 功能 。 此 外 ， 还 提供 有 关 安全 策略 模型 、 数 据 标记 以 及 主体 对 客体 
强制 访问 控制 的 非 形式 化 描述 ， 具 有 准确 地 标记 输出 信息 的 能 力 ; 消除 通过 测试 发 现 的 任何 
错误 。 

(4) 第 四 级 : 结构 化 保护 级 (对 应 TCSEC 的 B2 级 )。 本 级 的 计算 机 信息 系统 可 信 计 算 基 
建立 于 一 个 明确 定义 的 形式 化 安全 策略 模型 之 上 ， 它 要 求 将 第 三 级 系统 中 的 自主 和 强制 访问 控 
制 扩展 到 所 有 主体 与 客体 。 此 外 ， 还 要 考虑 隐蔽 通道 。 本 级 的 计算 机 信息 系统 可 信 计 算 基 必须 
结构 化 为 关键 保护 元 素 和 非 关键 保护 元 素 。 计 算 机 信息 系统 可 信 计 算 基 的 接口 也 必须 明确 定 
义 ， 使 其 设计 与 实现 能 经 受 更 充分 的 测试 和 更 完整 的 复审 。 它 加 强 了 鉴别 机 制 ; 支持 系统 管理 
员 和 操作 员 的 职能 ， 提 供 可 信 设 施 管理 ， 增 强 了 配置 管理 控制 。 系 统 具 有 相当 的 抗 渗透 能 力 。 

(5) 第 五 级 : 访问 验证 保护 级 (对 应 TCSEC 的 B3 级 )。 本 级 的 计算 机 信息 系统 可 信 计 算 
基 满 足 访 问 监控 器 需求 。 访问 监控 器 仲裁 主体 对 客体 的 全 部 访问 。 访 问 监控 器 本 身 是 抗 算 改 的 
必须 足够 小 ， 能 够 分 析 和 测试 。 为 了 满足 访问 监控 器 需求 ， 计 算 机 信息 系统 可 信 计 算 基 在 其 构 
造 时 ， 排 除 那些 对 实施 安全 策略 来 说 并 非 必要 的 代码 ; 在 设计 和 实现 时 ， 从 系统 工程 角度 将 其 
复杂 性 降低 到 最 小 程度 。 支 持 安全 管理 员 职 能 ;扩充 审计 机 制 ， 当 发 生 与 安全 相关 的 事件 时 发 
出 信号 ; 提供 系统 恢复 机 制 。 系 统 具 有 很 高 的 抗 渗透 能 力 。 


3. 数据 加 密 原理 


数据 加 密 是 防止 未 经 授权 的 用 户 访问 敏感 信息 的 手段 ， 这 就 是 人 们 通常 理解 的 安全 措施 ， 
也 是 其 他 安全 方法 的 基础 。 研 究 数 据 加 密 的 科学 叫 作 密码 学 (Cryptography)， 它 又 分 为 设计 密 
人 码 体制 的 密码 编码 学 和 破译 密码 的 密码 分 析 学 。 密 码 学 有 着 悠久 而 光辉 的 历史 ， 古 代 的 军事 家 
已 经 用 密码 传递 军事 情报 了 ， 而 现代 计算 机 的 应 用 和 计算 机 科学 的 发 展 又 为 这 一 古老 的 科学 注 
入 了 新 的 活力 。 现 代 密 码 学 是 经 典 密码 学 的 进一步 发 展 和 完善 。 由 于 加 密 和 解密 此 消 彼 长 的 斗 
争 永远 不 会 停止 ， 这 门 科 学 还 在 迅速 发 展 之 中 。 

一 般 的 保密 通信 模型 如 图 10-19 所 示 。 在 发 送 端 ， 把 明文 P 了 用 加 密 算法 E 和 密 钥 K 加密， 
变换 成 密 文 C， 即 

C-E(K, P) 


国医 
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在 接收 端 利用 解密 算法 D 和 密 钥 K 对 C 解密 得 到 明文 P， 即 
P=DGK. O) 
这 里 加 /解密 函数 E 和 D 是 公开 的 ， 而 密 钥 KK( 加 解密 函数 的 参数 ) 是 秘密 的 。 在 传送 过 
程 中 偷 听 者 得 到 的 是 无 法 理解 的 密 文 ， 而 他 又 得 不 到 密 钥 ， 这 就 达到 了 对 第 三 者 保密 的 目的 。 


发 送 端 偷 听 者 接收 端 
mr mi | rp Wir 
密 文 C=E(K,P) 
密 钥 K 密 钥 K 


图 10-19 0020 保密 通信 模型 


如 果 不 论 偷 听 者 获取 了 多 少 密 文 ， 但 是 密 文中 没有 足够 的 信息 ， 使 得 可 以 确定 出 对 应 的 明 
文 ， 则 这 种 密码 体制 叫 作 是 无 条 件 安全 的 ， 或 称 为 是 理论 上 不 可 破解 的 。 在 无 任何 限制 的 条 件 
下 ， 几 乎 目前 所 有 的 密码 体制 都 不 是 理论 上 不 可 破解 的 。 能 和 否 破解 给 定 的 密码 ， 取 决 于 使 用 的 
计算 资源 。 所 以 密码 专家 们 研究 的 核心 问题 就 是 要 设计 出 在 给 定 计算 费用 的 条 件 下 , 计算 上 (而 
不 是 理论 上 ) 安全 的 密码 体制 。 下 面 分 析 几 种 曾经 使 用 过 的 和 目前 正在 使 用 的 加 密 方法 。 


10.6 ”网 络 安全 概述 


由 于 网 络 传播 信息 快捷 ， 隐 项 性 强 ， 在 网 络 上 难以 识别 用 户 的 真实 身份 ， 网 络 犯罪 、 黑 客 
攻击 、 有 害 信息 传播 等 方面 的 问题 日 趋 严重 ， 网 络 安全 已 成 为 网 络 发 展 中 的 一 个 重要 课题 。 网 
络 安全 的 产生 和 发 展 ， 标 志 着 传统 的 通信 保密 时 代 过 渡 到 了 信息 安全 时 代 。 


1. 网 络 安全 威胁 


一 般 认为 ， 目 前 网 络 存在 的 威胁 主要 表现 在 以 下 5 个 方面 。 

(1) 非 授 权 访问 : 没有 预先 经 过 同意 ， 就 使 用 网 络 或 计算 机 资源 则 被 看 作 非 授权 访问 ， 如 
有 意 避 开 系统 访问 控制 机 制 ， 对 网 络 设备 及 资源 进行 非 正常 使 用 ， 或 擅自 扩大 权限 ， 越 权 访 问 
信息 。 它 主要 有 以 下 几 种 形式 : 假冒 、 身 份 攻击 、 非 法 用 户 进入 网 络 系统 进行 违法 操作 、 合 法 
用 户 以 未 授权 方式 进行 操作 等 。 

(2) 信息 泄露 或 丢失 : 指 敏感 数据 在 有 意 或 无 意 中 被 泄露 出 去 或 丢失 ， 它 通常 包括 信息 在 
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传输 中 丢失 或 泄露 、 信 息 在 存储 介质 中 丢失 或 泄露 以 及 通过 建立 隐蔽 隧道 等 窃取 敏感 信息 等 。 
如 黑客 利用 电磁 泄漏 或 搭 线 窃听 等 方式 可 截获 机 密 信息 ， 或 通过 对 信息 流向 、 流 量 、 通 信 频 度 
和 长 度 等 参数 的 分 析 ， 推 测 出 有 用 信息 ， 如 用 户口 令 、 账 号 等 重要 信息 。 

(3) 破坏 数据 完整 性 ， 以 非法 手段 穷 得 对 数据 的 使 用 权 ， 删 除 、 修 改 、 插 入 或 重 发 菜 些 重 
要 信息 ， 以 取得 有 益 于 攻击 者 的 响应 ， 恶 意 添加 ， 修 改 数据 ， 以 干扰 用 户 的 正常 使 用 。 

(4) 拒绝 服务 攻击 : 它 不 断 对 网 络 服务 系统 进行 干扰 ， 改 变 其 正常 的 作业 流程 ， 执 行 无 关 
程序 使 系统 响应 减 慢 甚至 瘫痪 ， 影 响 正常 用 户 的 使 用 ， 甚 至 使 合法 用 户 被 排斥 而 不 能 进入 计算 
机 网 络 系统 或 不 能 得 到 相应 的 服务 。 

(5) 利用 网 络 传播 病毒 : 通过 网 络 传播 计算 机 病毒 ， 其 破坏 性 大 大 高 于 单机 系统 ， 而 且 用 
户 很 难 防范 。 

2. 网 络 安全 控制 技术 


为 了 保护 网 络 信息 的 安全 可 靠 ， 除 了 运用 法 律 和 管理 手段 外 ， 还 需 依靠 技术 方法 来 实现 。 
网 络 安全 控制 技术 目前 有 防火 墙 技 术 、 加 密 技术 、 用 户 识别 技术 、 访 问 控制 技术 、 网 络 反 病 毒 
技术 、 网 络 安全 漏洞 扫描 技术 、 入 侵 检测 技术 等 。 

(1) 防火 墙 技术 。 防 火 墙 技术 是 近年 来 维护 网 络 安全 最 重要 的 手段 。 根 据 网 络 信息 保密 程 
度 ， 实 施 不 同 的 安全 策略 和 多 级 保护 模式 。 加 强 防 火 墙 的 使 用 ， 可 以 经 济 、 有 效 地 保证 网 络 安 
全 。 目 前 已 有 不 同 功 能 的 多 种 防火 墙 。 但 防火 墙 也 不 是 万 能 的 ， 需 要 配合 其 他 安全 措施 来 协同 
防范 。 

(2) 加 密 技术 。 加 密 技术 是 网 络 信息 安 全 主动 的 、 开 放 型 的 防范 手段 ， 对 于 敏感 数据 应 采 
用 加 密 处 理 ， 并 且 在 数据 传输 时 采用 加 密 传输 ， 目 前 加 密 技术 主要 有 两 大 类 : 一 类 是 基于 对 称 
密 钥 的 加 密 算法 ， 也 称 私 钥 算 法 ; 另 一 类 是 基于 非 对 称 密 钥 的 加 密 算法 ， 也 称 公 钥 算 法 。 加 密 
手段 一 般 分 软件 加 密 和 硬件 加 密 两 种 。 软 件 加 密 成 本 低 而 且 实 用 灵活 ， 更 换 也 方便 ， 硬 件 加 密 
效率 高 ， 本 身 安全 性 高 。 密 钥 管 理 包 括 密 钥 产 生 、 分 发 、 更 换 等 ， 是 数据 保密 的 重要 一 环 。 

(3) 用 户 识 别 技术 。 用 户 识别 和 验证 也 是 一 种 基本 的 安全 技术 。 其 核心 是 识别 访问 者 是 否 
属于 系统 的 合法 用 户 ， 目 的 是 防止 非法 用 户 进入 系统 。 目 前 一 般 采用 基于 对 称 密 钥 加 密 或 公开 
密 钥 加 密 的 方法 ， 采 用 高 强度 的 密码 技术 来 进行 身份 认证 。 比 较 著名 的 有 Kerberos、PGP 等 
方法 。 

(4) 访问 控制 技术 。 访 问 控制 是 控制 不 同 用 户 对 信息 资源 的 访问 权限 。 根 据 安全 策略 ， 对 
信息 资源 进行 集中 管理 ， 对 资源 的 控制 粒度 有 粗 粒度 和 细 粒 度 两 种 ， 可 控制 到 文件 、Web 的 


so 
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HTML 页 面 、 图 形 、CCT、Java 应 用 。 

(5) 网 络 反 病 毒 技术 。 计 算 机 病毒 从 1981 年 首次 被 发 现 以 来 ， 在 近 20 年 的 发 展 过 程 中 ， 
在 数目 和 危害 性 上 都 在 飞速 发 展 。 因 此 ， 计 算 机 病毒 问题 越 来 越 受 到 计算 机 用 户 和 计算 机 反 病 
毒 专家 的 重视 ， 并 且 开 发 出 了 许多 防 病毒 的 产品 。 

(6) 网 络 安全 漏洞 扫描 技术 。 漏 洞 检测 和 安全 风险 评估 技术 ， 可 预知 主体 受 攻击 的 可 能 性 
和 具体 地 指证 将 要 发 生 的 行为 和 产生 的 后 果 。 该 技术 的 应 用 可 以 帮助 分 析 资 源 被 攻击 的 可 能 指 
数 ， 了 解 支撑 系统 本 身 的 脆弱 性 ， 评 估 所 有 存在 的 安全 风险 。 网 络 漏洞 扫描 技术 ， 主 要 包括 网 
络 模拟 攻击 、 漏 洞 检测 、 报 告 服务 进程 、 提 取 对 象 信息 以 及 评测 风险 、 提 供 安全 建议 和 改进 措 
施 等 功能 ， 帮 助 用 户 控制 可 能 发 生 的 安全 事件 ， 最 大 可 能 地 消除 安全 隐患 。 

(7) 入 侵 检 测 技术 。 入 侵 行为 主要 是 指 对 系统 资源 的 非 授权 使 用 。 它 可 以 造成 系统 数据 的 
丢失 和 破坏 , 可 以 造成 系统 拒绝 合法 用 户 的 服务 等 危害 。 入 侵 者 可 以 是 一 个 手工 发 出 命令 的 人 ， 
也 可 以 是 一 个 基于 入 侵 脚 本 或 程序 的 自动 发 布 命令 的 计算 机 。 入 侵 者 分 为 两 类 : 外 部 入 侵 者 和 
允许 访问 系统 资源 但 又 有 所 限制 的 内 部 入 侵 者 。 内 部 入 侵 者 又 可 分 成 : 假扮 成 其 他 有 权 访 问 敏 
感 数 据 用 户 的 入 侵 者 和 能 够 关闭 系统 审计 控制 的 入 侵 者 。 入 侵 检测 是 一 种 增强 系统 安全 的 有 效 
技术 。 其 目的 就 是 检测 出 系统 中 违背 系统 安全 性 规则 或 者 威胁 到 系统 安全 的 活动 。 检 测 时 ， 通 
过 对 系统 中 用 户 行为 或 系统 行为 的 可 疑 程度 进行 评估 ， 并 根据 评估 结果 来 鉴别 系统 中 行为 的 正 
常 性 ， 从 而 帮助 系统 管理 员 进 行 安全 管理 或 对 系统 所 受到 的 攻击 采取 相应 的 对 策 。 

3， 防火 墙 技术 


防火 墙 (Firewall) 是 建立 在 内 外 网 络 边界 上 的 过 滤 封 锁 机 制 ， 它 认为 内 部 网 络 是 安全 和 
可 信赖 的 ， 而 外 部 网 络 是 不 安全 和 不 可 信赖 的 。 防 火 墙 的 作用 是 防止 不 希望 的 、 未 经 授权 地 进 
出 被 保护 的 内 部 网 络 ， 通 过 边界 控制 强化 内 部 网 络 的 安全 策略 。 防 火 墙 作 为 网 络 安全 体系 的 基 
础 和 核心 控制 设施 ， 贯 穿 于 受 控 网 络 通信 主干 线 ， 对 通过 受 控 干 线 的 任何 通信 行为 进行 安全 处 
理 ， 如 控制 、 审 计 、 报 警 和 反应 等 ， 同 时 也 承担 着 繁重 的 通信 任务 。 由 于 其 自身 处 于 网 络 系统 
中 的 敏感 位 置 ， 自 身 还 要 面 对 各 种 安全 威胁 ， 因 此 ， 选 用 一 个 安全 、 稳 定 和 可 靠 的 防火 墙 产品 ， 
其 重要 性 不 言 而 喻 。 

防火 墙 技术 经 历 了 包 过 滤 、 应 用 代理 网 关 和 状态 检测 技术 三 个 发 展 阶段 。 

1) 包 过 滤 防 火 墙 

包 过 滤 防 火 墙 一 般 有 一 个 包 检查 块 〈 通 常 称 为 包 过 滤器 )， 数 据 包 过 滤 可 以 根据 数据 包头 
中 的 各 项 信息 来 控制 站 点 与 站 点 、 站 点 与 网 络 、 网 络 与 网 络 之 间 的 相互 访问 ， 但 无 法 控制 传输 
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数据 的 内 容 ， 因 为 内 容 是 应 用 层 数据 ， 而 包 过 滤器 处 在 网 络 层 和 数据 链 路 层 ( 即 TCP 和 下 层 ) 
之 间 。 通 过 检查 模块 ， 防 火 墙 能 够 拦截 和 检查 所 有 出 站 和 进 站 的 数据 ， 它 首先 打开 包 ， 取 出 包 
头 ， 根 据 包头 的 信息 确定 该 包 是 否 符合 包 过 滤 规 则 ， 并 进行 记录 。 对 于 不 符合 规则 的 包 ， 应 进 
行 报警 并 丢弃 该 包 。 

过 滤 型 的 防火 墙 通常 直接 转发 报 文 ， 它 对 用 户 完 全 透明 ， 速 度 较 快 。 其 优点 是 防火 墙 对 每 
条 传 入 和 传 出 网 络 的 包 实 行 低 水 平 控制 ， 每 个 他 包 的 字段 都 被 检查 ， 例 如 源 地 址 、 目 的 地 址 、 
协议 和 端口 等 ; 防火 墙 可 以 识别 和 丢弃 带 欺骗 性 源 中 地 址 的 包 ; 包 过 滤 防 火 墙 是 两 个 网 络 之 间 
访问 的 唯一 来 源 ， 包 过 滤 通 常 被 包含 在 路 由 器 数据 包 中 ， 所 以 不 需要 额外 的 系统 来 处 理 这 个 特 
征 。 缺 点 是 不 能 防范 黑客 攻击 ， 因 为 网 管 不 可 能 区 分 出 可 信和 网 络 与 不 可 信和 网 络 的 界限 不 支持 
应 用 层 协 议 ， 因 为 它 不 识别 数据 包 中 的 应 用 层 协 议 ， 访 问 控制 粒度 太 粗糙 ， 不 能 处 理 新 的 安全 
威胁 。 

2) 应 用 代理 网 关 防 火 墙 

应 用 代理 网 关 防 火 墙 彻底 隔断 内 网 与 外 网 的 直接 通信 ,内 网 用 户 对 外 网 的 访问 变 成 防火 南 
对 外 网 的 访问 ， 然 后 再 由 防火 墙 转发 给 内 网 用 户 。 所 有 通信 都 必须 经 应 用 层 代理 软件 转发 ， 访 
问 者 任何 时 候 都 不 能 与 服务 器 建立 直接 的 TCP 连接 , 应 用 层 的 协议 会 话 过 程 必须 符合 代理 的 安 
全 策略 要 求 。 

应 用 代理 网 关 的 优点 是 可 以 检查 应 用 层 、 传 输 层 和 网 络 层 的 协议 特征 ， 对 数据 包 的 检测 能 
力 比较 强 。 缺 点 是 难以 配置 ， 处 理 速 度 非常 慢 。 

3) 状态 检测 技术 防火 墙 

状态 检测 技术 防火 增 结 合 了 代理 防火 增 的 安全 性 和 包 过 滤 防 火 墙 的 高 速度 等 优点 , 在 不 损 
失 安 全 性 的 基础 上 ， 提 高 了 代理 防火 增 的 性 能 。 

状态 检测 防火 墙 气 弃 了 包 过 滤 防 火 墙 仅 考 查 数据 包 的 人 P 地 址 等 儿 个 参数 而 不 关心 数据 包 
连接 状态 变化 的 缺点 ， 在 防火 墙 的 核心 部 分 建立 状态 连接 表 ， 并 将 进出 网 络 的 数据 当成 一 个 个 
的 会 话 ， 利 用 状态 表 跟 踪 每 一 个 会 话 状态 。 状 态 监 测 对 每 一 个 包 的 检查 不 仅 根据 规则 表 ， 更 考 
虑 了 数据 包 是 否 符合 会 话 所 处 的 状态 ， 因 此 提供 了 完整 的 对 传输 层 的 控制 能 力 ， 同 时 也 改进 了 
流量 处 理 速度 。 因 为 它 采 用 了 一 系列 优化 技术 ， 使 防火 墙 性 能 大 幅度 提升 ， 能 应 用 在 各 类 网 络 
环境 中 ， 尤 其 是 在 一 些 规则 复杂 的 大 型 网 络 上 。 

一 个 防火 墙 系统 通常 是 由 过 滤 路 由 器 和 代理 服务 器 组 成 。 过 滤 路 由 器 是 一 个 多 端口 的 中 
路 由 器 ， 它 能 够 拦截 和 检查 所 有 出 站 和 进 站 的 数据 。 代 理 服务 器 防火 墙 使 用 一 个 客户 程序 与 特 
定 的 中 间 结 点 《防火 墙 ) 连接 ， 然 后 中 间 结 点 与 期 望 的 服务 器 进行 实际 连接 。 这 样 ， 内 部 与 外 
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部 网 络 之 间 不 存在 直接 连接 ， 因 此 ， 即 使 防火 墙 发 生 了 问题 ， 外 部 网 络 也 无 法 获得 与 被 保护 的 
网 络 的 连接 。 典 型 防火 墙 的 体系 结构 分 为 包 过 滤 路 由 器 、 双 宿主 主机 、 屏 蔽 主机 网 关 和 被 屏蔽 
子 网 等 类 型 。 


4. 人 入侵 检 测 与 防御 


入 侵 检 测 系统 (Intrusion Detection System，IDS) 作为 防火 墙 之 后 的 第 二 道 安 全 屏障 ， 通 
过 从 计算 机 系统 或 网 络 中 的 若干 关键 点 收集 网 络 的 安全 日 志 、 用 户 的 行为 、 网 络 数据 包 和 审计 
记录 等 信息 并 对 其 进行 分 析 ， 从 中 检查 是 否 有 违反 安全 策略 的 行为 和 遭 到 入 侵 攻 击 的 迹象 ， 入 
侵 检测 系统 根据 检测 结果 ， 自 动 做 出 响应 。IDS 的 主要 功能 包括 对 用 户 和 系统 行为 的 监测 与 分 
析 、 系 统 安全 漏洞 的 检查 和 扫描 、 重 要 文件 的 完整 性 评估 、 己 知 攻击 行为 的 识别 、 异 常 行为 模 
式 的 统计 分 析 、 操 作 系统 的 审计 跟踪 ， 以 及 违反 安全 策略 的 用 户 行为 的 检测 等 。 入 侵 检 测 通过 
实时 地 监控 入 侵 事件 ， 在 造成 系统 损坏 或 数据 丢失 之 前 阻止 入 侵 者 进一步 的 行动 ， 使 系统 能 尽 
可 能 的 保持 正常 工作 。 与 此 同时 ，IDS 还 需要 收集 有 关 入 侵 的 技术 资料 ， 用 于 改进 和 增强 系统 
抵抗 入 侵 的 能 力 。 

入 侵 检测 系统 有 效 的 弥补 了 防火 墙 系统 对 网 络 上 的 入 侵 行为 无 法 识别 和 检测 的 不 足 ， 入 侵 
检测 系统 的 部 署 , 使 得 在 网 络 上 的 入 侵 行为 得 到 了 较 好 的 检测 和 识别 , 并 能 够 进行 及 时 的 报警 。 
然而 ， 随 着 网 络 技术 的 不 断 发 展 ， 网 络 攻 击 类 型 和 方式 也 在 进行 着 巨大 的 变化 ， 入 侵 检 测 系统 
也 逐渐 的 暴露 出 如 漏 报 、 误 报 率 高 、 灵 活性 差 和 入 侵 响 应 能 力 较 弱 等 不 足 之 处 。 

入 侵 防 御 系统 是 在 入 侵 检测 系统 的 基础 上 发 展 起 来 的 ， 入 侵 防御 系统 不 仅 能 够 检测 到 网 络 
中 的 攻击 行为 ， 同 时 主动 的 对 攻击 行为 能 够 发 出 响应 ， 对 攻击 进行 防御 。 两 者 相 较 ， 主 要 存在 
以 下 几 种 区 别 。 

(1) 在 网 络 中 的 部 署 位 置 的 不 同 。 

IPS 一 般 是 作为 一 种 网 络 设 备 串 接 在 网 络 中 的 ， 而 IDS 一 般 是 采用 旁 路 挂 接 的 方式 ， 连 接 
在 网 络 中 。 

(2) 入 侵 响 应 能 力 的 不 同 。 

IDS 设备 对 于 网 络 中 的 入 侵 行为 ， 往 往 是 采用 将 入 侵 行 为 记 入 日 志 ， 并 向 网 络 管理 员 发 出 
警报 的 方式 来 处 理 的 ， 对 于 入 侵 行为 并 无 主动 的 采取 对 应 措施 ， 响 应 方式 单一 ， 而 入 侵 防 御 系 
统 检测 到 入 侵 行为 后 ， 能 够 对 攻击 行为 进行 主动 的 防御 ， 例 如 丢弃 攻击 连接 的 数据 包 以 阻 断 攻 
击 会 话 ， 主 动 发 送 ICMP 不 可 到 达 数 据 包 、 记 录 日 志和 动态 的 生成 防御 规则 等 多 种 方式 对 攻击 
行为 进行 防御 。 
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11.1 标准 化 基础 知识 


标准 (Standard) 是 对 重复 性 事物 和 概念 所 做 的 统一 规定 。 规 范 (Specification)、 规程 (Code) 
都 是 标准 的 一 种 形式 。 标 准 化 〈Standardization) 是 在 经 济 、 技 术 、 科 学 及 管理 等 社会 实践 中 ， 
以 改进 产品 、 过 程 和 服务 的 适用 性 ,防止 贸易 壁垒， 促进 技术 合作 ,促进 最 大 社会 效益 为 目的 ， 
对 重复 性 事物 和 概念 通过 制定 、 发 布 和 实施 标准 达到 统一 ， 获 最 佳 秩序 和 社会 效益 的 过 程 。 


11.1.1 基本 概念 


标准 是 标准 化 活动 的 产物 ， 其 目的 和 作用 都 是 通过 制定 和 贯彻 具体 的 标准 来 体现 的 。 标 准 
化 不 是 一 个 孤立 的 事物 ,而 是 一 个 活动 过 程 。 标 准 化 活动 过 程 一 般 包 括 标准 产生 (调查 、 研 究 、 
形成 草案 、 批 准 发 布 ) 子 过 程 、 标 准 实施 〈 宣 传 、 普 及 、 监 督 、 咨 询 ) 子 过 程 和 标准 更 新 〈 复 
审 、 废 止 或 修订 ) 子 过 程 等 。 


1. 标准 的 分 类 


可 以 从 不 同 的 角度 和 属性 将 标准 进行 分 类 。 

1) 根据 适用 范围 分 类 

根据 标准 制定 的 机 构 和 标准 适用 的 范围 , 可 分 为 国际 标准 、 国 家 标准 、 行 业 标准 、 企业 (机 
构 ) 标准 及 项 目 〈 课 题 )》 标准。 

(1) 国际 标准 〈International Standard)。 国 际 标准 是 指 国 际 标准 化 组 织 ISO)、 国 际 电工 
委员 会 (IEC) 所 制定 的 标准 ， 以 及 JSO 出 版 的 《国际 标准 题 内 关键 词 索引 (KWIC Index)》 中 
收录 的 其 他 国际 组 织 制定 的 标准 。 国 际 标准 在 世界 范围 内 统一 使 用 ， 各 国 可 以 自愿 采用 ， 不 强 
制 使 用 。 

(2) 国家 标准 (National Standard)。 国 家 标准 是 由 政府 或 国家 级 的 机 构 制 定 或 批准 的 、 适 
用 于 全 国 范围 的 标准 ， 是 一 个 国家 标准 体系 的 主体 和 基础 ， 国 内 各 级 标准 必须 服从 且 不 得 与 之 
相抵 触 。 常 见 的 国家 标准 如 下 。 
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@ 中 华人 民 共 和 国 国家 标准 (GB)。GB 是 我 国 最 高 标准 化 机 构 中 华人 民 共 和 国 国 家 技术 
监督 局 所 公布 实施 的 标准 ， 简 称 为 “国标 ”。 

@ 美国 国家 标准 (ANSI)。ANSI 是 美国 国家 标准 协会 (American National Standards 
Institute，ANSI) 制定 的 标准 。 

@ 英国 国家 标准 (British Standard，BS)。BS 是 英国 标准 学 会 (BSI) 制定 的 标准 。 

@ 日 本 工业 标准 (Japanese Industrial Standard，JIS)。JIS 是 日 本 工业 标准 调查 会 (JISC) 
制定 的 标准 。 

(3) 区 域 标准 (Regional Standard)。 区 域 标准 〈 也 称 地 区 标准 ) 泛 指 世界 上 按 地 理 、 经 济 
或 政治 划分 的 某 一 区 域 标 准 化 团体 所 通过 的 标准 。 它 是 为 了 某 一 区 域 的 利益 建立 的 标准 。 通常 ， 
地 区 标准 主要 是 指 太平 洋 地 区 标准 会 议 (PASC)、 欧 洲 标准 化 委员 会 (CEN)、 亚 洲 标准 咨询 委 
员 会 (ASAC)、 非 洲 地 区 标准 化 组 织 (ARSO) 等 地 区 组 织 所 制定 和 使 用 的 标准 。 

(4) 行业 标准 (Specialized Standard)。 行 业 标 准 是 由 行业 机 构 、 学 术 团体 或 国防 机 构 制定 ， 
并 适用 于 某 个 业务 领域 的 标准 ， 有 以 下 一 些 标准 。 

@ 美国 电气 和 电子 工程 师 学 会 标准 (IEEE)。IEEE 通过 的 标准 常常 要 报请 ANSI 审批 ,使 
其 具有 国家 标准 的 性 质 。 因 此 ，IEEE 公布 的 标准 常 冠 有 ANSI 字 头 。 例 如 ，ANSIIEEE Str 
828-1983〈 软 件 配置 管理 计划 标准 )。 

@ 中 华人 民 共 和 国 国家 军用 标准 (GJB)。GJB 是 由 我 国 国防 科学 技术 工业 委员 会 批准 ， 
适用 于 国防 部 门 和 军队 使 用 的 标准 。 例 如 , 1988 年 发 布 实施 的 GJB473-88( 军 用 软件 开发 规范 )。 
我 国 各 主管 部 、 委 〈 局 ) 批准 发 布 ， 在 其 范围 内 统一 使 用 的 标准 。 

@ 美国 国防 部 标准 (Department Of Defense-Standards，DOD-STD)。DOD-STD 适用 于 美 
国 国防 部 门 。 美 国 军 用 标准 MIL-S (Military-Standards) 适用 于 美军 内 部 。 

(5) 企业 标准 (Company Standard)。 企 业 标准 是 由 企业 或 公司 批准 、 发 布 的 标准 ， 某 些 产 
品 标准 由 其 上 级 主管 机 构 批准 、 发 布 。 

例如 ， 美 国 IBM 公司 通用 产品 部 (General Products Division) 1984 年 制定 的 “程序 设计 
发 指南 ”， 仅 供 该 公司 内 部 使 用 。 

(6) 项 目 规范 (Project Specification)。 由 某 一 科研 生产 项 目 组 织 制 定 ， 且 为 该 项 任务 专用 
的 软件 工程 规范 。 例 如 ， 计 算 机 集成 制造 系统 “CIMS) 的 软件 工程 规范 。 

根据 《中 华人 民 共 和 国标 准 化 法 》 的 规定 ， 我 国标 准 分 为 国家 标准 、 行 业 标准 、 地 方 标准 和 
企业 标准 4 类。 这 4 类 标准 主要 是 适用 的 范围 不 同 ， 不 是 标准 技术 水 平 高 低 的 分 级 。 

(1) 国家 标准 。 由 国务 院 标准 化 行政 主管 部 门 制定 的 需要 全 国 范围 内 统一 的 技术 要 求 。 

(2) 行业 标准 。 没 有 国家 标准 而 又 需 在 全 国 某 个 行业 范围 内 统一 的 技术 标准 ， 由 国务 院 
有 关 行 政 主管 部 门 制定 并 报国 务 院 标准 化 行政 主管 部 门 备案 的 标准 。 

(3) 地 方 标准 。 没 有 国家 标准 和 行业 标准 而 又 需 在 省 、 自 治 区 、 直 辖 市 范围 内 统一 的 工 
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业 产 品 的 安全 、 卫 生 要 求 ， 由 省 、 自 治 区 、 直 辖 市 标准 化 行政 主管 部 门 制定 并 报国 务 院 标准 化 
行政 主管 部 门 和 国务 院 有 关 行 业 行政 主管 部 门 备案 的 标准 。 

(4) 企业 标准 。 企 业 生产 的 产品 没有 国家 标准 、 行 业 标准 和 地 方 标准 ， 由 企业 自行 组 织 
制定 、 作 为 组 织 生产 依 据 的 相应 标准 ， 或 者 在 企业 内 制定 适用 的 ， 比 国家 标准 、 行 业 标准 或 地 
方 标准 更 严格 的 企业 《〈 内 控 ) 标准 ， 并 按 省 、 自 治 区 、 直 辖 市 人 民政 府 的 规定 备案 的 标准 〈 不 
含 内 控 标准 )。 

2) 根据 标准 的 性 质 分 类 

根据 标准 的 性 质 可 分 为 技术 标准 、 管 理 标准 和 工作 标准 。 

(1) 技术 标准 〈Technique Standard)。 技 术 标准 是 针对 重复 性 的 技术 事项 而 制定 的 标准 ， 是 
从 事 生产 、 建 设 及 商品 流通 时 需要 共同 遵守 的 一 种 技术 依据 。 

(2) 管理 标准 (Administrative Standard)。 管 理 标准 是 管理 机 构 为 行使 其 管理 职能 而 制定 的 
具有 特定 管理 功能 的 标准 , 主要 用 于 规定 人 们 在 生产 活动 和 社会 实践 中 的 组 织 结构 、 职 责 权限 、 
过 程 方法 、 程 序 文件 、 资 源 分 配 以 及 方针 、 目 标 、 措 施 、 影 响 管理 的 因素 等 事宜 ， 它 是 合理 组 
织 国民 经 济 ， 正 确 处 理 各 种 生产 关系 ， 正 确实 现 合理 分 配 ， 提 高 生产 效率 和 效益 的 依据 。 在 实 
际 工作 中 通常 按照 标准 所 起 的 作用 不 同 ， 将 管理 标准 分 为 技术 管理 标准 、 生 产 组 织 标准 、 经 济 
管理 标准 、 行 政 管理 标准 、 业 务 管理 标准 和 工作 标准 等 。 

(3) 工作 标准 (Work Standard)。 为 协调 整个 工作 过 程 ， 提 高 工作 质量 和 效率 ， 针 对 有 具体 
岗位 的 工作 制定 的 标准 。 对 工作 的 内 容 、 方 法 、 程 序 和 质量 要 求 所 制定 的 标准 ， 称 为 工作 标准 。 
工作 标准 的 内 容 包 括 各 岗位 的 职责 和 任务 、 每 项 任务 的 数量 、 质 量 要 求 及 完成 期 限 ， 完 成 各 项 
任务 的 程序 和 方法 ， 与 相关 岗位 的 协调 、 信 息 传递 方式 ， 工 作 人 员 的 考核 与 奖 罚 方法 等 。 对 生 
产 和 业务 处 理 的 先后 顺序 、 内 容 和 要 达到 的 要 求 所 作 的 规定 称 为 工作 程序 标准 。 以 管理 工作 为 
对 象 所 制定 的 标准 ， 称 为 管理 工作 标准 。 管理 工作 标准 的 内 容 主要 包括 工作 范围 、 内 容 和 要 求 ; 
与 相关 工作 的 关系 ; 工作 条 件 ， 工 作 人 员 的 职权 与 必 备 条 件 ， 工作 人 员 的 考核 、 评 价 及 奖惩 办 
法 等 。 

3) 根据 标准 化 的 对 象 和 作用 分 类 

根据 标准 的 对 象 和 作用 ， 标 准 可 分 为 基础 标准 、 产 品 标准 、 方 法 标准 、 安 全 标准 、 卫 生 标 
准 、 环 境 保 护 标准 和 服务 标准 等 。 

4) 根据 法 律 的 约束 性 分 类 

根据 标准 的 法 律 约束 性 ， 可 分 为 强制 性 标准 和 推荐 性 标准 。 

(1) 强制 性 标准 。 根 据 《 标 准 化 法 》 的 规定 ， 企 业 和 有 关 部 门 对 涉及 其 经 营 、 生 产 、 服 务 、 
管理 有 关 的 强制 性 标准 都 必须 严格 执行 ， 任 何 单位 和 个 人 不 得 擅自 更 改 或 降低 标准 。 对 违反 强 
制 性 标准 而 造成 不 良 后 果 以 至 重大 事故 者 ， 由 法 律 、 行 政法 规 规定 的 行政 主管 部 门 依法 根据 情 
节 轻 重 给 予 行政 处 罚 ， 直 至 由 司法 机 关 追 究 刑事 责任 。 
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强制 性 标准 是 国家 技术 法 规 的 重要 组 成 ， 它 符合 世界 贸易 组 织 贸易 技术 壁垒 协定 关于 “ 技 
术 法 规 ” 定 义 ， 即 “强制 执行 的 规定 产品 特性 或 相应 加 工 方法 的 包括 可 适用 的 行政 管理 规定 在 
内 的 文件 。 技 术 法 规 也 可 包括 或 专门 规定 用 于 产品 、 加 工 或 生产 方法 的 术语 、 符 号 、 包 装 标志 
或 标签 要 求 ” 为 使 我 国 强制 性 标准 与 WTO/TBT 规定 衔接 ,其 范围 限制 在 国家 安全 、 防 止 欺 诈 
行为 、 保 护 人 身 健康 与 安全 、 保 护 动物 植物 的 生命 和 健康 以 及 保护 环境 等 方面 。 

(2) 推荐 性 标准 。 在 生产 、 交 换 、 使 用 等 方面 ， 通 过 经 济 手段 或 市 场 调节 而 自愿 采用 的 一 
类 标准 称 为 推荐 性 标准 。 这 类 标准 不 具有 强制 性 ， 任 何 单位 均 有 权 决 定 是 否 采 用 ， 违 反 这 类 标 
准 ， 不 构成 经 济 或 法 律 方面 的 责任 。 应 当 指 出 的 是 ， 推 荐 性 标准 一 经 接受 并 采用 ， 或 由 各 方 商 
定 后 同意 纳入 经 济 合同 中 ， 就 成 为 各 方 必须 共同 遵守 的 技术 依据 ， 具 有 法 律 上 的 约束 性 。 


2. 标准 的 代号 和 编号 


1) 国际 标准 ISO 的 代号 和 编号 

国际 标准 ISO 的 代号 和 编号 的 格式 为 ISO+ 标 准 号 +[ 杠 + 分 标准 号 ]+ 冒 号 + 发 布 年 号 〈( 方 括 
号 中 的 内 容 可 有 可 无 )， 例 如 ，ISO 8402: 1987 和 ISO 9000-1: 1994 是 ISO 标准 的 代号 和 编号 。 

2) 国家 标准 的 代号 和 编号 

我 国 国家 标准 的 代号 由 大 写 汉 语 拼音 字母 构成 ， 强 制 性 国家 标准 代号 为 GB， 推 荐 性 国家 
标准 的 代号 为 GB/T。 

国家 标准 的 编号 由 国家 标准 的 代号 、 标 准 发 布 顺 序号 和 标准 发 布 年 代号 (4 位 数 ) 组 成 。 

(1) 强制 性 国家 标准 : GB XXXXX 一 XXXX。 

(2) 推荐 性 国家 标准 : GB/T XXXXXX 一 XXXxX。 

3) 行业 标准 的 代号 和 编号 

(1) 行业 标准 代号 。 行 业 标 准 代号 由 汉语 拼音 大 写字 母 组 成 ， 由 国务 院 各 有 关 行 政 主管 部 
门 提出 其 所 管理 的 行业 标准 范围 的 申请 报告 ， 国 务 院 标 准 化 行政 主管 部 门 审查 确定 并 正式 公布 
该 行业 标准 代号 。 已 正式 公布 的 行业 代号 有 QJ (航天 )、SJ (电子 )、 聘 〈 机 械 ) 和 玉 (金融 
系统 ) 等 。 

(2) 行业 标准 的 编号 。 行 业 标准 的 编号 由 行业 标准 代号 、 标 准 发 布 顺序 及 标准 发 布 年 代号 
(4 位 数 ) 组 成 ， 表 示 方 法 如 下 。 

。 强制 性 行业 标准 编号 : XX xXxx 一 XxXxXxx。 

。 ”推荐 性 行业 标准 编号 : XX/T XXXxxXx 一 XXXxX。 

4) 地 方 标准 的 代号 和 编号 

(1) 地 方 标准 的 代号 。 由 大 写 汉 语 拼音 DB 加 上 省 、 自 治 区 、 直 辖 市 行政 区 划 代 码 的 前 两 
位 数字 如 北京 市 11、 天 津 市 12、 上 海 市 31 等 )， 再 加 上 和 斜 线 组 成 推荐 性 地 方 标准 ; 不 加 
斜 线 T 为 强制 性 地 方 标准 ， 表 示 方 法 如 下 。 
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。 强制 性 地 方 标准 : DBX xX。 

。 ”推荐 性 地 方 标准 : DBX X/T。 

(2) 地 方 标准 的 编号 。 地 方 标准 的 编号 由 地 方 标准 代号 、 地 方 标准 发 布 顺序 号 和 标准 发 布 
年 代号 (4 位 数 ) 3 个 部 分 组 成 ， 表 示 方 法 如 下 。 

。 强制 性 地 方 标准 : DBXX XXX 一 XXXX。 

。 ”推荐 性 地 方 标准 : DBX X/T XXX 一 XXXxX。 

5) 企业 标准 的 代号 和 编号 

(1) 企业 标准 的 代号 。 企 业 标准 的 代号 由 汉语 大 写 拼 音字 母 Q 加 和 斜 线 再 加 企业 代号 组 成 ， 
企业 代号 可 用 大 写 拼音 字母 、 阿 拉 伯 数字 或 两 者 兼用 组 成 。 企 业 代 号 按 中 央 所 属 企业 和 地 方 企 
业 分 别 由 国务 院 有 关 行 政 主管 部 门 或 省 、 自 治 区 、 直 辖 市 政府 标准 化 行政 主管 部 门 会 同 同 级 有 
关 行 政 主管 部 门 加 以 规定 。 例 如 ，Q/X X X 。 企 业 标准 一 经 制定 颁布 ， 即 对 整个 企业 具有 约束 
性 ， 是 企业 法 规 性 文件 ， 没 有 强制 性 企业 标准 和 推荐 性 企业 标准 之 分 。 

(2) 企业 标准 的 编号 。 企 业 标准 的 编号 由 企业 标准 代号 、 标 准 发 布 顺序 号 和 标准 发 布 年代 
号 (4 位 数 ) 组 成 ， 表 示 方 法 : QXXX XXXX 一 XXXX。 


3. 国际 标准 和 国外 先进 标准 


国际 标准 和 国外 先进 标准 集中 了 一 些 先进 工业 国家 的 技术 经 验 ， 世 界 各 国都 积极 采用 国际 
标准 或 先进 的 标准 。 

1) 国际 标准 

国际 标准 是 指 国 际 标准 化 组 织 、 国 际 电工 委员 会 所 制定 的 标准 ， 以 及 ISO 出 版 的 《国际 标 
准 题 内 关键 词 索引 (KWIC Index)》 中 收录 的 其 他 国际 组 织 制定 的 标准 ,1983 年 3 月 出 版 的 KWIC 
索引 (第 1 版 中 共 收 录 了 24 个 国际 组 织 制定 的 7600 个 标准 ， 其 中 ISO 标准 占 68%，IEC 标 
准 占 18.5%， 其 他 22 个 国际 组 织 的 标准 共 968 个 ， 占 13.5%。1989 年 出 版 的 KWIC 索引 (第 2 
版 ) 共 收 录 了 ISO 与 EC 制定 的 800 个 标准 ， 以 及 其 他 27 个 国际 组 织 的 1200 多 条 标准 。ISO 
推荐 列 入 KWIC 索引 的 有 27 个 国际 组 织 ， 一 些 未 列 入 《KWIC Index》 的 国际 组 织 所 制定 的 某 
些 标准 也 被 国际 公认 。 这 27 个 国际 组 织 制定 的 标准 化 文献 主要 有 国际 标准 、 国 际 建议 、 国 际 
公约 、 国 际 公约 的 技术 附录 和 国际 代码 ， 也 有 经 各 国政 府 认可 的 强制 性 要 求 。 对 国际 贸易 业务 
服务 和 信息 交流 具有 重要 影响 。 

2) 国外 先进 标准 

国外 先进 标准 是 指 国际 上 有 权威 的 区 域 性 标准 ; 世界 上 经 济 发 达 国 家 的 国家 标准 和 通行 的 
团体 标准 ; 包括 知名 企业 标准 在 内 的 其 他 国际 上 公认 的 先进 标准 ， 主 要 有 以 下 几 种 标准 。 

(1) 国际 上 有 权威 的 区 域 性 标准 。 如 欧洲 标准 化 委员 会 (CEN)、 欧 洲 电工 标准 化 委员 会 
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(CENELEC)、 欧 洲 广 播 联 盟 (EBU)、 亚 洲 大 洋 洲 开放 系统 互联 研讨 会 AOW)、 亚 洲 电子 数 
据 交 换 理事 会 (ASEB) 等 制定 的 标准 。 

(2) 世界 经 济 技术 发 达 国 家 的 国家 标准 。 如 美国 国家 标准 、 德 国 国 家 标准 (DIN)、 英 国 国 
家 标准 、 日 本 国 工业 标准 、 瑞 典 国 家 标准 (SIS)、 法 国 国家 标准 (NF)、 瑞 士 国 家 标准 (SNV)、 
意大利 国家 标准 (UNI) 和 俄罗斯 国家 标准 (TOCTP) 等 。 

(3) 国际 公认 的 行业 性 团体 标准 。 如 美国 材料 与 实验 协会 标准 “ASTM)、 美 国 石油 学 会 标 
准 (API)、 美 国 军用 标准 (MIL)、 美 国电 气 制 造 商 协会 标准 (NEMA)、 美 国电 影 电视 工程 师 协 
会 标准 (SMPTE)、 美 国 机 械 工程 师 协会 标准 (ASME ) 和 英国 石油 学 会 ( 卫 ) 等 。 

(4) 国际 公认 的 先进 企业 标准 。 如 美国 IBM 公司 、 美 国 HP 公司 、 芬 兰 诺基亚 公司 和 瑞士 
钟表 公司 等 企业 标准 等 。 

3) 采用 国际 标准 和 国外 先进 标准 的 原则 

(1) 根据 我 国 国民 经 济 发 展 的 需要 ， 确 定 一 定时 期 采用 国际 标准 和 国外 先进 标准 的 方向 、 
任务 。 当 国民 经 济 处 于 建立 社会 主义 经 济 体系 初期 ， 采 用 国际 标准 和 国外 先进 标准 就 是 要 从 战 
略 上 、 从 国家 长 远 利益 上 考虑 突出 国际 标准 中 的 重大 基础 标准 、 通 用 方法 标准 的 采用 问题 。 当 
国民 经 济 发 展 到 一 定 阶 段 ， 如 产品 质量 要 赶 超 世 界 先进 水 平时 ， 国 际 标准 和 国外 先进 标准 中 的 
先进 产品 标准 和 质量 标准 就 成 为 采用 的 重要 对 象 。 

(2) 很 多 国际 标准 是 国际 上 取得 多 年 实际 经 验 后 被 公认 的 ， 一 般 来 说 不 必 都 去 进行 实践 验 
证 。 为 加 快 采用 国际 标准 和 国外 先进 标准 的 速度 ， 一 般 都 简化 制定 手续 ， 基 本 上 采取 “ 先 拿 来 
用 ， 然 后 实践 验证 ， 再 补充 修改 ”的 模式 。 

(3) 促进 产品 质量 水 平 的 提高 是 当前 采用 国际 标准 和 国外 先进 标准 的 一 项 重要 原则 。 产 品 
质量 问题 首先 有 标准 问题 ， 只 有 采用 了 先进 的 国际 标准 或 先进 的 国外 标准 ， 才 能 提高 我 国 的 标 
准 水 平 。 只 有 提高 了 标准 水 平 ， 才 能 有 力 地 促进 产品 质量 的 提高 。 如 果 要 赶 超 世 界 先进 水 平 ， 
就 要 采用 国际 标准 和 国外 先进 标准 。 

(4) 要 紧密 结合 我 国 实际 情况 、 自 然 资源 和 自然 条 件 ， 需 符合 国家 的 有 关 法 令 、 法 规 和 政 
策 ， 做 到 技术 先进 、 经 济 合理 、 安 全 可 靠 、 方 便 使 用 、 促 进 生 产 力 发 展 。 

(5) 对 于 国际 标准 中 的 基础 标准 、 方 法 标准 、 原 材料 标准 和 通用 零 部 件 标准 ， 需 要 先行 采 
用 。 通 过 的 基础 标准 、 方 法 标准 以 及 有 关 安 全 、 卫 生 和 环境 保护 等 方面 的 标准 ， 一 般 应 与 国际 
标准 协调 一 致 。 

(6) 在 技术 引进 和 设备 进口 中 采用 国际 标准 ， 应 符合 《技术 引进 和 设备 进口 标准 化 审查 管 
理 办 法 (试行 )》 中 的 规定 。 例 如 ， 原 则 上 不 引进 和 进口 英制 设备 ， 等 等 。 

(7) 当 国际 标准 不 能 满足 要 求 或 尚 无 国际 标准 时 , 应 参照 上 述 原则 积极 采用 国外 先进 标准 。 
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4) 采用 程度 

采用 国际 标准 或 国外 先进 标准 的 程度 ， 分 为 等 同 采用 、 等 效 采 用 和 非 等 效 采 用 。 

(1) 等 同 采用 。 指 国家 标准 等 同 于 国际 标准 ， 仅 有 或 没有 编辑 性 修改 。 编 辑 性 修改 是 指 不 
改变 标准 技术 的 内 容 的 修改 。 如 纠正 排版 或 印刷 错误 ; 标点 符号 的 改变 ;增加 不 改变 技术 内 容 
的 说 明 、 提 示 等 。 因 此 ， 可 以 认为 等 同 采 用 就 是 指 国家 标准 与 国际 标准 相同 ， 不 做 或 稍 做 编辑 

(2) 等 效 采 用 。 指 国家 标准 等 效 于 国际 标准 ， 技 术 内 容 上 只 有 很 小 差异 。 编 辑 上 不 完全 相 
同 ， 编 写 方法 不 完全 相对 应 。 如 奥地利 标准 ONORMS 5022 内 河 船 舶 噪声 测量 标准 中 ， 包 括 一 
份 试验 报告 的 推荐 格式 ， 而 相应 的 国际 标准 ISO 2922 中 没有 此 内 容 。 

(3) 非 等 效 采 用 。 指 国家 标准 不 等 效 于 国际 标准 ， 在 技术 上 有 重大 技术 差异 。 即 国家 标准 
中 有 国际 标准 不 能 接受 的 条 款 ， 或 者 在 国际 标准 中 有 国家 标准 不 能 接受 的 条 款 。 在 技术 上 有 重 
大 差异 的 情况 下 ， 虽 然 国 家 标准 制定 时 是 以 国际 标准 为 基础 ， 并 在 很 大 程度 上 与 国际 标准 相 适 
应 ， 但 不 能 使 用 “等 效 ”这 个 术语 。 通 常 包 括 以 下 3 种 情况 。 

@ 国家 标准 包含 的 内 容 比 国际 标准 少 。 国 家 标准 较 国 际 要 求 低 或 选 国际 标准 中 部 分 内 容 。 
国家 标准 与 国际 标准 之 间 没 有 互相 接受 条 款 的 “ 逆 定 理 ” 情 况 。 

@ 国家 标准 包含 的 内 容 比 国 际 标准 多 。 国 家 标准 增加 了 内 容 或 类 型 ， 且 具有 较 高 要 求 等 ， 
也 没有 “ 逆 定 理 ” 情 况 。 

@ 国家 标准 与 国际 标准 有 重合 。 部 分 内 容 是 完全 相同 或 技术 上 相同 ， 但 在 其 他 内 容 上 却 
互 不 包括 对 方 的 内 容 。 

采用 国际 标准 或 国外 先进 标准 , 按 国家 标准 GB161 的 规定 编写 。 采用 程度 符号 用 缩写 字母 
表示 ， 等 同 采用 idt 或 IDT 表示 ， 等 效 采 用 eqv 或 EQV 表示 ， 非 等 效 采 用 neq 或 NEQ 表示 。 

Q@ 等 同 采用 : GB XXXX 一 XXXX (idtISo XXXXx 一 XXXxXx)。 

@ 等 效 采 用 : GB XXXX 一 XXXX (eqvISO XXXX 一 XXXX)。 

@ 非 等 效 采 用 : GB XXXX 一 XXXX CneqISOXXXxX 一 XXXX)。 


11.1.2 信息 技术 标准 化 


信息 技术 标准 化 是 围绕 信息 技术 开发 、 信 息 产品 的 研制 和 信息 系统 建设 、 运 行 与 管理 而 开 
展 的 一 系列 标准 化 工作 。 其 中 主要 包括 信息 技术 术语 、 信 息 表 示 、 汉 字 信 息 处 理 技术 、 媒 体 、 
软件 工程 、 数 据 库 、 网 络 通信 、 电 子 数据 交换 、 电 子 卡 、 管 理 信息 系统 和 计算 机 辅助 技术 等 方 
面 的 标准 化 。 


1. 信息 编码 标准 化 
编码 是 一 种 信息 表现 形式 和 信息 交换 的 技术 手段 。 对 信息 进行 编码 实际 上 是 对 文字 、 音频 、 
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图 形 和 图 像 等 信息 进行 处 理 ， 使 之 量化 ， 从 而 便于 利用 各 种 通信 设备 进行 信息 传递 和 利用 计算 
机 进行 信息 处 理 。 作 为 一 种 信息 交换 的 技术 手段 ， 必 须 保 证 信息 交换 的 一 致 性 。 为 了 统一 编码 
系统 ， 人 们 借助 了 标准 化 这 个 工具 ， 制 定 了 各 种 标准 代码 ， 如 国际 上 比较 通用 的 ASCI 码 ( 美 
国信 息 交 换 标准 代码 ) 。 


2. 汉字 编码 标准 化 


汉字 编码 是 对 每 一 个 汉字 按 一 定 的 规律 用 若干 个 字母 、 数 字 、 符 号 表示 出 来 。 汉 字 编 码 的 
方法 很 多 ， 主 要 有 数字 编码 ， 如 电报 码 、 四 角 号 码 ; 拼音 编码 ， 即 用 汉字 的 拼音 字母 对 汉字 进 
行 编码 ， 字 形 编码 ， 即 用 汉字 的 偏旁 部 首 和 笔划 结构 与 各 个 英文 字母 相对 应 ， 再 用 英文 字母 的 
组 合 代表 相应 的 汉字 。 对 于 每 一 种 汉字 编码 ， 计 算 机 内 部 都 有 一 种 相应 的 二 进 制 内 部 码 ， 不 同 
的 汉字 编码 在 使 用 上 不 能 替换 。 

我 国 在 汉字 编码 标准 化 方面 取得 的 突出 成 就 就 是 信息 交换 用 汉字 编码 字符 集 国家 标准 的 
制定 。 该 字符 集 共 有 6 集 。 其 中 ，GB 2312 一 80 信息 交换 用 汉字 编码 字符 集 是 基本 集 ， 收 入 常 
用 基本 汉字 和 字符 7445 个 。GB 7589 一 87 和 GB 7590 一 87 分 别 是 第 二 辅助 集 和 第 四 辅助 集 ， 
各 收入 现代 规范 汉字 7426 个 。GB/T 12345 一 90 是 辅助 集 ， 它 与 第 三 辅助 集 和 第 五 辅助 集 分 别 
是 与 基本 集 、 第 二 辅助 集 和 第 四 辅助 集 相对 应 的 繁体 字 的 汉字 字符 集 。 除 汉字 编码 标准 化 外 ， 
汉字 信息 处 理 标准 化 的 内 容 还 包括 汉字 键盘 输入 的 标准 化 ; 汉字 文字 识别 输入 和 语音 识别 输入 
的 标准 化 ， 汉 字 输 出 字体 和 质量 的 标准 化 ， 汉 字 属 性 和 汉语 词语 的 标准 化 等 。 


3. 软件 工程 标准 化 


软件 工程 的 目的 是 改善 软件 开发 的 组 织 ， 降 低 开发 成 本 ， 缩 短 开 发 时 间 ， 提 高 工作 效率 ， 
提高 软件 质量 。 它 在 内 容 上 包括 软件 开发 的 软件 概念 形成 、 需 求 分 析 、 计 划 组 织 、 系 统 分 析 与 
设计 、 结 构 程序 设计 、 软 件 调 试 、 软 件 测试 和 验收 、 安 装 和 检验 、 软 件 运行 和 维护 ， 以 及 软件 
运行 的 终止 。 同 时 还 有 许多 技术 管理 工作 ， 如 过 程 管理 、 产 品 管理 、 资 源 管理 ， 以 及 确认 与 验 
证 工作 ， 如 评审 与 审计 、 产 品 分 析 等 。 软 件 工程 最 显著 的 特点 就 是 把 个 别 的 、 自 发 的 、 分 散 的 、 
手工 的 软件 开发 变 成 一 种 社会 化 的 软件 生产 方式 。 软 件 生产 的 社会 化 必然 要 求 软 件 工程 实行 标 
准 化 。 

软件 工程 标准 化 的 主要 内 容 包括 过 程 标准 〈 如 方法 、 技 术 和 度量 等 )、 产 品 标准 〈 如 需求 、 
设计 、 部 件 、 描 述 、 计 划 和 报告 等 )、 专 业 标 准 ( 如 道德 准则 、 认 证 等 )、 记 法 标准 (如 术语 、 
表示 法 和 语言 等 )、 开 发 规范 (准则 、 方 法 和 规程 等 )、 文 件 规范 文件 范围 、 文 件 编制 、 文 件 
内 容 要 求 、 编 写 提示 )、 维 护 规范 〈 软 件 维护 、 组 织 与 实施 等 ) 以 及 质量 规范 〈 软 件 质量 保证 、 
软件 配置 管理 、 软 件 测试 和 软件 验收 等 ) 等 。 

我 国 1983 年 5 月 成 立 “ 计 算 机 与 信息 处 理 标准 化 技术 委员 会 ” 下 设 13 个 分 技术 委员 会 ， 
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其 中 程序 设计 语言 分 技术 委员 会 和 软件 工程 技术 委员 会 与 软件 相关 。 我 国 推行 软件 工程 标准 化 
工作 的 总 原则 是 向 国际 标准 靠拢 ， 对 于 能 够 在 我 国 适用 的 标准 全 部 按 等 同 采用 的 方法 ， 以 促进 
国际 交流 。 现 已 得 到 国家 批准 的 软件 工程 国家 标准 如 下 。 

1) 基础 标准 

(1) 信息 处 理 一 程序 构造 及 其 表示 法 的 约定 GB/T 13502 一 92。 

(2) 信息 处 理 系 统一 计算 机 系统 配置 图 符号 及 其 约定 GB/T 14085 一 93。 

(3) 软件 工程 术语 标准 GB/T 11457 一 89。 

(4) 软件 工程 标准 分 类 法 GB/T 15538 一 95。 

2) 开发 标准 

(1) 软件 开发 规范 GB 8566 一 88。 

(2) 计算 机 软件 单元 测试 GB/T 15532 一 95。 

(3) 软件 维护 指南 GB/T 14079 一 93。 

3) 文档 标准 

(1) 计算 机 软件 产品 开发 文件 编制 指南 GB 8567 一 88。 

(2) 计算 机 软件 需求 说 明 编 制 指南 GB/T 9385 一 88。 

(3) 计算 机 软件 测试 文件 编制 指南 GB/T 9386 一 88。 

4) 管理 标准 

(1) 计算 机 软件 配置 管理 计划 规范 GB/T 12505 一 90。 

(2) 计算 机 软件 质量 保证 计划 规范 GB/T 12504 一 90。 

(3) 计算 机 软件 可 靠 性 和 可 维护 性 管理 GB/T 14394 一 93。 

(4) 信息 技术 、 软 件 产品 评价 、 质 量 特性 及 其 使 用 指南 GB/T 16260 一 96。 


11.1.3 ”标准 化 组 织 


ISO 和 IEC 是 世界 上 两 个 最 大 、 最 具有 权威 的 国际 标准 化 组 织 。 目 前 ， 由 ISO 确认 并 公布 
的 国际 标准 化 组 织 还 有 国际 计量 局 (BIPM)、 联 合 国教 科 文 组 织 (UNESCO)、 世 界 卫生 组 织 
CWHO)、 世 界 知识 产权 组 织 (WIPO)、 国 际 信息 与 文献 联合 会 (FID)、 国 际 法 制 计量 组 织 (OIML) 
等 27 个 国际 组 织 。 

(1) 国际 标准 化 组 织 (International Organization for Standardization，ISO )。 国 际 标准 化 组 
织 是 世界 上 最 大 的 非 政 府 性 的 ， 由 各 国标 准 化 团体 (ISO 成 员 团 体 ) 组 成 的 世界 性 联合 专门 机 
构 。 它 成 立 于 1947 年 2 月 ， 其 宗旨 是 世界 范围 内 促进 标准 化 工作 的 发 展 ， 以 利于 国际 资源 的 
交流 和 合理 配置 ， 扩 大 各 国 在 知识 、 科 学 、 技 术 和 经 济 领域 的 合作 。 其 主要 活动 是 制定 国际 标 
准 ， 协 调 世 界 范围 内 的 标准 化 工作 ， 组 织 各 成 员 国 和 技术 委员 会 进行 交流 ， 以 及 与 其 他 国际 性 
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组 织 进行 合作 ， 共 同 研究 有 关 标 准 问题 ， 出 版 ISO 国际 标准 。 制 定 国际 标准 的 工作 通常 由 ISO 
的 技术 委员 会 完成 ， 各 成 员 团体 若 对 某 技术 委员 会 确立 的 项 目 感 兴趣 ， 均 有 权 参 加 该 委员 会 的 
工作 。 与 ISO 保持 联系 的 各 国际 组 织 〈 宣 方 的 或 非 方 的 ) 也 可 参加 有 关 工 作 。 此 外 ，ISO 还 负 
责 协 调 世 界 范围 内 的 标准 化 工作 ， 组 织 各 成 员 国 和 技术 委员 会 进行 情报 交流 ， 并 和 其 他 国际 性 
组 织 保持 联系 和 合作 , 共同 研究 感 兴趣 的 有 关 标 准 化 问题 。 在 电工 技术 标准 化 方面 , ISO 与 IEC 
保持 密切 合作 关系 。ISO 的 工作 语言 是 英文 、 法 文 、 俄 文 ， 会 址 设 在 日 内 瓦 。 

ISO 的 成 员 团体 分 正式 成 员 和 通信 成 员 。 正 式 成 员 是 指 由 各 国 最 有 代表 性 的 标准 化 机 构 代 
表 其 国家 或 地 区 参加 ， 并 且 只 允许 每 个 国家 有 一 个 组 织 参 加 。 通 信 成 员 是 尚未 建立 全 国 性 标准 
化 机 构 的 国家 ， 一 般 不 参与 ISO 的 技术 工作 ， 但 可 参与 了 解 工作 进展 ， 当 条 件 成 熟 时 ， 可 以 通 
过 一 定 程序 成 为 正式 成 员 。1947 年 ，ISO 成 立时 只 有 25 个 成 员 团体 ， 但 经 过 50 年 的 发 展 ， 现 
有 团体 〈 国 家 标准 化 机 构 ) 135 个 ， 其 中 成 员 团体 〈 正 式 成 员 ) 90 个 、 通 信 成 员 35 个 、 注 册 成 
员 9 个 。 

成 员 全 体 大 会 是 ISO 的 最 高 权力 机 构 。 理 事 会 是 ISO 常务 机 构 ， 由 正 、 副 主席 ， 司 库 和 18 
个 理事 国 代表 组 成 ， 每 年 召开 一 次 会 议 ， 理 事 会 成 员 任期 三 年 ， 每 年 改选 1/3 的 成 员 。 理 事 会 下 
设 若干 专门 委员 会 ， 其 中 之 一 是 技术 委员 会 “TC)， 技 术 委 员 会 完成 ISO 的 技术 工作 ，ISO 按 专 
业 性 质 设立 技术 委员 会 ， 各 技术 委员 会 根据 工作 需要 可 设立 若干 分 委员 会 (SC)，TC 和 SC 下 面 
可 设立 若干 工作 组 (WG)。TC 和 SC 的 成 员 分 为 积极 参加 成 员 (了 成 员 ) 和 观察 员 (O 成 员 ) 两 
种 。P 成 员 可 参与 TC、SC 的 技术 工作 ， 而 O 成员 则 只 能 了 解 工作 进度 和 得 到 技术 组 织 的 信息 资 
料 ， 不 参加 技术 工作 。 每 个 TC 或 SC 均 从 了 成 员 中 任命 一 个 成 员 主持 秘书 处 并 领导 该 委员 会 怠 
分 委员 会 。ISO 现 有 技术 组 织 2871 个 ， 其 中 技术 委员 会 191 个 、 分 技术 委员 会 572 个 、 工 作 组 
2063 个 ， 临 时 专题 小 组 45 个 。 

(2) 国际 电工 委员 会 (Intemational Electrotechnical Commission，IEC)。 国 际 电工 委员 会 月 
立 于 1906 年 , 是 世界 上 最 早 的 非 政府 性 国际 电工 标准 化 机 构 , 是 联合 国 经 社 理事 会 (ECOSOC) 
的 甲 级 咨询 组 织 。 自 1947 年 ISO 成 立 后 ，IEC 曾 作为 一 个 电工 部 并 入 ISO, 但 在 技术 上 和 财务 
上 仍 保持 独立 。1976 年 ， 双 方 又 达成 新 协议 ，IEC 从 ISO 中 分 离 出 来 ， 两 组 织 各 自 独 立 ， 自 愿 
合作 ， 互 为 补充 ， 共 同 建 立国 际 标准 化 体系 ，IEC 负责 有 关 电 气 工 程 及 电子 领域 国际 标准 化 工 
作 ， 其 他 领域 则 由 ISO 负责 。 

IEC 的 工作 领域 包括 电工 领域 各 个 方面 ， 如 电力 、 电 子 、 电 信和 原子 能 方面 的 电工 技术 等 。 
理事 会 是 IEC 的 最 高 权利 机 构 ， 会 址 设 在 日 内 瓦 。IEC 理事 会 下 设 执行 委员 会 和 合格 评定 局 ， 
执行 委员 会 负责 管理 技术 委员 会 和 技术 咨询 委员 会 : 合格 评定 局 管理 各 认证 委员 会 ， 在 组 织 上 
自 成 体系 。 它 是 世界 范围 的 自愿 认证 机 构 ， 其 宗旨 是 促进 国家 或 国际 间 的 自由 贸易 。 按 照 严 格 
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的 认证 程序 ， 以 国际 标准 为 依据 对 电工 产品 生产 厂 的 技术 力量 和 管理 水 平实 行 全 面 的 审核 和 评 
审 ; 对 要 求 认证 的 生产 的 元 器 件 ， 按 标准 要 求 进行 测试 检验 。 对 符合 质量 要 求 的 产品 授 以 合格 
证 书 ， 以 确保 产品 质量 达到 和 保持 标准 要 求 的 质量 水 平 。 

(3) 区 域 标准 化 组 织 。 区 域 是 指 世界 上 按 地 理 、 经 济 或 民族 利益 划分 的 区 域 。 参 加 组 织 的 
机 构 有 的 是 政府 性 的 ， 有 的 是 非 政府 性 的 ， 是 为 发 展 同一 地 区 或 毗邻 国家 间 的 经 济 及 贸易 ， 维 
护 该 地 区 国家 的 利益 ， 协 调 本 地 区 各 国标 准 和 技术 规范 而 建立 的 标准 化 机 构 。 其 主要 职能 是 制 
定 、 发 布 和 协调 该 地 区 的 标准 。 

@ 欧洲 标准 化 委员 会 (CEN)。CEN 成 立 于 1961 年 ， 是 由 欧洲 经 济 共同 体 (EEC)、 欧 
洲 自由 联盟 (EFTA) 所 属国 家 的 标准 化 机 构 所 组 成 ， 主 要 任务 是 协调 各 成 员 国 的 标准 ， 制 定 必 
要 的 欧洲 标准 EN)， 实 行 区 域 认证 制度 。 

@ 欧洲 电工 标准 化 委员 会 (CEN EL EC)。CEN EL EC 成 立 于 1972 年 ， 是 由 欧洲 电工 标 
准 协调 委员 会 (CEN EL) 和 欧洲 电工 协调 委员 会 共同 市 场 小 组 〈CEN EL COM) 合并 组 成 的 ， 
主要 是 协调 各 成 员 国电 器 和 电子 领域 的 标准 ， 以 及 电子 元 器 件 质量 认证 ， 制 定 部 分 欧洲 标准 。 

@ 亚洲 标准 咨询 委员 会 (ASAC)。ASAC 成 立 于 1967 年 ， 由 联合 国 亚洲 与 太平 洋 经 社 
委员 会 协商 建立 ， 主 要 是 在 I SO、IEC 标准 的 基础 上 ， 协 调 各 成 员 国标 准 化 活动 ， 制 定 区 域 性 

@ 国际 电信 联盟 (Intemational Telecommunication Union，ITU)。ITU 于 1865 年 5 月 在 
巴黎 成 立 ，1947 年 成 为 联合 国 的 专门 机 构 ， 是 世界 各 国政 府 的 电信 主管 部 门 之 间 协 调 电信 事务 
的 一 个 国际 组 织 , 研究 制定 有 关 电 信 业 务 的 规章 制度 ,通过 决议 提出 推荐 标准 ,收集 有 关 情 报 。 
ITU 的 目的 和 任务 是 维持 和 发 展 国际 合作 ， 以 改进 和 合理 利用 电信 ， 促 进 技术 设施 的 发 展 及 有 
效应 用 ， 以 提高 电信 业务 的 效率 。 

(4) 行业 标准 化 组 织 。 行 业 标准 化 组 织 是 指 制定 和 公布 适应 于 某 个 业务 领域 标准 的 专业 标 
准 化 团体 ， 以 及 在 其 业务 领域 开展 标准 化 工作 的 行业 机 构 、 学 术 团 体 或 国防 机 构 。 

GD 美国 电气 电子 工程 师 学 会 (Institute of Electrical and Electronics Engineers, IEEE)。 IEEE 
是 由 美国 电气 工程 师 学 会 (AIEE) 和 美国 无 线 电工 程 师 学 会 (了 RE) 于 1963 年 合并 而 成 ， 是 美 
国 规模 最 大 的 专业 学 会 。IEEE 主要 制定 的 标准 内 容 有 电气 与 电子 设备 、 试 验方 法 、 元 器 件 、 符 
号 、 定 义 以 及 测试 方法 等 。 近 年 来 ， 该 学 会 专门 成 立 了 软件 标准 分 技术 委员 会 (SESS)， 积 极 
开展 了 软件 标准 化 活动 ， 取得 了 显著 成 果 , 受到 了 软件 界 的 关注 。IEEE 通过 的 标准 常常 要 报请 
ANSI 审批 ， 使 其 具有 国家 标准 的 性 质 。 因 此 ，IEEE 公布 的 标准 常 冠 有 ANSI 字 头 。 例 如 ， 
ANSIIEEE Str 828-1983 软件 配置 管理 计划 标准 。 

@ 美国 国防 部 批准 、 颁 布 适用 于 美国 军队 内 部 使 用 的 标准 ， 代 号 为 DOD (采用 公制 计量 


_ 
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单位 的 以 DOD 表示 ) 和 MIL。 

@ 我 国 国防 科学 技术 工业 委员 会 批准 、 颁 布 适合 于 国防 部 门 和 军队 使 用 的 标准 ， 代 号 为 
GJB。 例 如 ，1988 年 发 布 实施 的 GJB473-88 军用 软件 开发 规范 。 

(5) 国家 标准 化 组 织 。 国 家 标准 化 组 织 是 指 在 国家 范围 内 建立 的 标准 化 机 构 ， 以 及 政府 确 
认 (或 承认 ) 的 标准 化 团体 ， 或 者 接受 政府 标准 化 管理 机 构 指 导 并 具有 权威 性 的 民间 标准 化 团 
体 。 这 些 组 织 主 要 如 下 。 

@ 美国 国家 标准 学 会 ‘American National Standards Institute，ANSI)。ANSI 是 非 赢利 性 
质 的 民间 标准 化 团体 ， 但 它 实际 上 已 成 为 美国 国家 标准 化 中 心 ， 美 国 各 界 标 准 化 活动 都 围绕 它 
开展 。 通 过 它 使 政府 有 关系 统 和 民间 系统 相互 配合 ， 起 到 了 政府 和 民间 标准 化 系统 之 间 的 桥梁 
作用 。ANSI 协调 并 指导 美国 全 国 的 标准 化 活动 ， 给 标准 制定 、 研 究 和 使 用 单位 以 帮助 ， 提 供 
国内 外 标准 化 情报 。ANSI 本 身 很 少 制定 标准 ， 主 要 是 将 其 他 专业 标准 化 机 构 的 标准 经 协商 后 
冠 以 ANSI 代号 ， 成 为 美国 国家 标准 。 

@ 英国 标准 学 会 (British Standards Institution，BSID)。BSI 是 世界 上 最 早 的 全 国 性 标准 化 
机 构 ， 它 是 政府 认可 的 、 独 立 的 、 非 盈利 性 民间 标准 化 团体 ， 主 要 任务 是 为 增产 节约 而 努力 协 
调 生 产 者 和 用 户 之 问 的 关系 ， 促 进 生 产 ， 达 到 标准 化 ; 制定 和 修订 英国 标准 ， 并 促进 其 贯彻 执 
行 ， 以 学 会 名 义 ， 对 各 种 标志 进行 登记 ， 并 颁发 许可 证 ; 必要 时 采取 各 种 行动 ， 保 护 学 会 利益 ; 
对 外 代表 英国 参加 国际 或 区 域 标准 化 活动 。 

@ 德国 标准 化 学 会 (Deutsches Institution fur Normung，DIN)。DIN 始 建 于 1917 年 ， 当 
时 称 为 德国 工业 标准 委员 会 NADI)，1926 年 改 为 德国 标准 委员 会 (DNA)，1975 年 又 改名 为 
联邦 德国 标准 化 学 会 。DIN 是 一 个 经 注册 的 公益 性 民间 标准 化 团体 ， 前 联邦 政府 承认 它 为 联邦 
德国 和 西柏 林 的 标准 化 机 构 。 

@ 法 国标 准 化 协会 ‘Association Francaise de Normalisation，AFNOR )。AFNOR 成 立 于 
1926 年 ， 它 是 一 个 公益 性 的 民间 团体 ， 也 是 一 个 被 政府 承认 ， 为 国家 服务 的 组 织 。1941 年 5 
月 24 日 颁布 的 一 项 法 令 确 认 AFNOR 接受 法 国政 府 的 标准 化 管理 机 构 “ 标 准 化 专署 ”指导 , 按 
政府 指导 开展 工作 ， 并 定期 向 标准 化 专员 汇报 工作 。AFNOR 负责 标准 的 制定 、 修 订 工 作 ， 宣 
传 、 出 版 、 发 行 标准 ， 实 施 产品 质量 认证 。 

11.1.4 1SO 9000 标准 简介 


ISO 9000 标准 是 一 系列 标准 的 统称 。ISO 9000 系列 标准 由 ISO/TC176 制定 。TC176 是 ISO 
的 第 176 个 技术 委员 会 〈 质 量 管理 和 质量 保证 技术 委员 会 )， 专 门 负责 制定 质量 管理 和 质量 保证 
技术 的 标准 。 经 过 TC176 多 年 的 协调 以 及 有 关 国家 质量 管理 专家 近 10 年 的 不 懈 努 力 ， 总 结 了 
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美国 、 英 国 和 加 拿 大 等 工业 发 达 国 家 的 质量 保证 技术 实践 的 经 验 ， 于 1986 年 6 月 15 日 正式 发 
布 了 ISO 8402《 质 量 一 术语 》 标 准 ， 又 于 1987 年 3 月 正式 公布 了 ISO 9000~ISO 9004 的 5 项 
标准 ， 这 5 项 标准 与 ISO 8402: 1986 一 起 统称 为 ISO 9000: 1987 系列 标准 。2000 年 12 月 15 
日 ，ISO 9000: 2000 系列 标准 正式 发 布 实施 。 

ISO 9000 系列 标准 的 质量 管理 模式 为 企业 管理 注入 新 的 活力 和 生机 , 给 质量 管理 体系 提供 
评价 基础 ， 为 企业 进行 世界 贸易 带 来 质量 可 信 度 。 从 ISO 9000 系列 标准 的 演变 过 程 可 见 ，ISO 
9001: 1987 系列 标准 从 自我 保证 的 角度 出 发 ， 更 多 关注 的 是 企业 内 部 的 质量 管理 和 质量 保证 ; 

ISO 9001: 1994 系列 标准 则 通过 20 个 质量 管理 体系 要 素 ， 把 用 户 要 求 、 法 规 要 求 及 质量 保证 
的 要 求 纳入 标准 的 范围 中 ; ISO 9001: 2000 系列 标准 在 标准 构思 和 标准 目的 等 方面 体现 了 具有 
时 代 气 息 的 变化 , 过 程 方法 的 概念 , 顾客 需求 的 考虑 ， 以 及 将 持续 改进 的 思想 贯穿 于 整个 标准 ， 
把 组 织 的 质量 管理 体系 满足 顾客 要 求 的 能 力 和 程度 体现 在 标准 的 要 求 之 中 。 


1.ISO 9000: 2000 系列 标准 文件 结构 


ISO 9000: 2000 族 标准 现 有 14 项 标准 ， 由 4 个 核心 标准 、 一 个 支持 标准 、6 个 技术 报告 、 
3 个 小 册子 构成 ， 如 表 11-1 所 示 。 


表 11-1 ISO 9000: 2000 系列 标准 文件 结构 

ISO 9000: 2000《 质 量 管理 体系 基础 和 术语 》 

ISO 9001: 2000《 质 量 管理 体系 要 求 》 

ISO 9004: 2000《 质 量 管理 体系 业绩 改进 指南 》 

ISO 19011: 2000《 质 量 和 环境 管理 审核 指南 》 
支持 标准 ISO 10012《 测 量 设 备 的 质量 保证 要 求 》 

ISO 10006《 项 目 管理 指南 》 

ISO 10007《 技 术 状 态 管理 指南 》 

ISO 10013《 质 量 管理 体系 文件 指南 》 

ISO 10014《 质 量 经 济 性 指南 》 

ISO 10015《 教 育 和 培训 指南 》 

ISO 10017《 统 计 技术 在 ISO 9001 中 的 应 用 指南 》 

质量 管理 原理 
小 册子 选择 和 使 用 指南 

小 型 企业 的 应 用 指南 


核心 标准 


技术 报告 


2. ISO 9000: 2000 核心 标准 简介 


(1) ISO 9000: 2000《 质 量 管理 体系 基础 和 术语 》。 该 标准 描述 了 质量 管理 体系 的 基础 ， 
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并 规定 了 质量 管理 体系 的 术语 和 基本 原理 。 术 语 标准 是 讨论 问题 的 前 提 ， 统 一 术语 是 为 了 明确 
概念 ， 建 立 共 同 的 语言 。 

该 标准 在 总 结 了 质量 管理 经 验 的 基础 上 ， 明 确 了 一 个 组 织 在 实施 质量 管理 中 必须 遵循 的 8 
项 质量 管理 原则 ， 也 是 ISO 9000: 2000 族 标准 制定 的 指导 思想 和 理论 基础 。 该 标准 提出 的 10 
个 部 分 ， 87 个 术语 , 在 语言 上 强调 采用 非 技术 性 语言 , 使 所 有 潜在 用 户 易于 理解 。 为 便于 使 用 ， 
在 标准 附录 中 ， 推 荐 了 以 “概念 图 ”方式 来 描述 相关 术语 的 关系 。 

(2) ISO 9001: 2000《 质 量 管理 体系 要 求 》。 该 标准 提供 了 质量 管理 体系 的 要 求 ， 供 组 织 
证 实 其 提供 满足 顾客 和 适用 法 规 要 求 产 品 的 能 力 时 使 用 。 组 织 通过 有 效 地 实施 体系 ， 包 括 过 程 
的 持续 改进 和 预防 不 合格 ， 使 顾客 满意 。 该 标准 是 用 于 第 三 方 认证 的 唯一 质量 管理 体系 要 求 标 
准 ， 通 常用 于 企业 建立 质量 管理 体系 以 及 申请 认证 。 它 主要 通过 对 申请 认证 组 织 的 质量 管理 体 
系 提出 各 项 要 求 来 规范 组 织 的 质量 管理 体系 ， 主 要 分 为 5 大 模块 的 要 求 ， 即 质量 管理 体系 、 管 
理 职责 、 资 源 管理 、 产 品 实现 、 测 量 分 析 和 改进 ， 构 成 一 种 过 程 方法 模式 的 结构 ， 符 合 PDCA 
循环 规则 ， 且 通过 持续 改进 的 环节 使 质量 管理 体系 的 水 平 达到 螺旋 式 上 升 的 效应 ， 其 中 每 个 模 
块 中 又 有 许多 分 条 款 。 

(3) ISO 9004: 2000《 质 量 管理 体系 业绩 改进 指南 》。 该 标准 给 出 了 改进 质量 管理 体系 业 
绩 的 指南 ， 描 述 了 质量 管理 体系 应 包括 持续 改进 的 过 程 ， 强 调 通过 改进 过 程 ， 提 高 组 织 的 业绩 ， 
使 组 织 的 顾客 和 其 他 相关 方 满意 。 

该 标准 和 ISO 9001: 2000 协调 一 致 并 可 一 起 使 用 的 质量 管理 体系 标准 ， 两 个 标准 采用 相同 
的 原则 ， 但 应 注意 其 适用 范围 不 同 ， 而 且 JSO 9004 标准 不 拟 作为 ISO 9001 标准 的 实施 指南 。 
通常 情况 下 ， 当 组 织 的 管理 者 希望 超越 ISO 9001 标准 的 最 低 要 求 ， 追 求 增长 的 业绩 改进 时 ， 一 
般 以 ISO 9004 标准 作为 指南 。 

(4) ISO 19011: 2001《 质 量 和 环境 管理 体系 审核 指南 》。 该 标准 提供 了 质量 管理 体系 和 环 
境 管理 体系 审核 的 基本 原则 、 审 核 方案 的 管理 、 环 境 和 质量 管理 体系 的 实施 以 及 对 环境 和 质量 
管理 体系 评审 员 资格 要 求 提 供 了 指南 。 

该 标准 是 ISO/TC 176 与 ISO/TC 207 (环境 管理 技术 委员 会 ) 联合 制订 的 ， 按 照 “ 不 同 管 
理 体 系 ， 可 以 共同 管理 和 审核 ”的 原则 ， 在 术语 和 内 容 方 面 兼容 了 质量 管理 体系 和 环境 管理 体 
系 两 方面 特点 。 


3.ISO 9000: 2000 系列 标准 确认 的 8 项 原则 


ISO 9000 族 质量 管理 体系 在 ISO 9000: 2000 和 ISO 9004: 2000 标准 中 提 及 的 8 项 质量 管 
理 原 则 是 以 顾客 为 中 心 、 领 导 作 用 、 全 员 参 与 、 过 程 方法 、 管 理 的 系统 方法 、 持 续 改进 、 基 于 
事实 的 决策 方法 、 互 利 的 供 方 关系 。 
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11.1.5 ”ISO/IEC 15504 过 程 评估 标准 简介 


ISO/TEC15504 由 ISO/EC JTC1/SC7/WG10 与 其 项 目 组 软件 过 程 改进 和 能 力 确定 (Software 
Process Improve- ment and Capability determination，SPICE) 和 国际 项 目 管理 机 构 共 同 完 成 ， 并 
收集 整理 了 来 自 20 多 个 国家 的 工业 、 政 府 以 及 大 学 专家 的 意见 和 建议 ， 同 时 得 到 世界 各 地 软件 
工程 师 的 帮助 ， 包 括 与 美国 SEI、 加 拿 大 贝尔 合作 。 

ISO/TEC 15504 提供 了 一 个 软件 过 程 评估 的 框架 ， 它 可 以 被 任何 软件 企业 用 于 软件 的 设计 、 
管理 、 监 督 、 控 制 以 及 提高 获得 、 供 应 、 开 发 、 操 作 、 升 级 和 支持 的 能 力 。ISO/IEC 15504 提供 
了 一 种 有 组 织 的、 结构 化 的 软件 过 程 评估 方法 ， 以 便 实施 软件 过 程 的 评估 。 在 ISO/EC 15504 中 
定义 的 过 程 评估 办 法 则 在 为 描述 工程 评估 结果 的 通用 方法 提供 一 个 基本 原则 , 同时 也 对 建立 在 不 
同 但 兼容 的 模型 和 方法 上 的 评估 进行 比较 。 

在 ISO/IEC 15504 文件 中 涉及 了 过 程 评估 的 各 个 方面 ， 其 文档 主要 包括 以 下 几 个 部 分 。 

1. 概念 和 绪论 指南 

该 部 分 给 出 了 关于 软件 过 程 改进 和 过 程 评估 概念 及 其 在 过 程 能 力 确定 方面 的 总 体 信 息 。 它 
描述 了 ISO/TEC 15504 文档 的 各 部 分 是 如 何 组 织 在 一 起 的 ， 并 为 选择 和 使 用 各 部 分 提供 指南 。 
此 外 ， 本 部 分 还 解释 了 ISO/TEC 15504 中 所 包含 的 要 求 对 执行 评估 的 适用 性 ， 支持 工具 的 建立 
与 选择 以 及 在 附加 过 程 的 建立 和 发 展 方面 所 起 的 作用 。 


2. 过 程 和 过 程 能 力 参考 模型 


该 部 分 从 内 容 上 说 是 在 比较 高 的 层次 上 详细 定义 了 一 个 用 于 过 程 评估 的 二 维 参 考 模型 。 此 
模型 中 描述 了 过 程 和 过 程 能 力 。 通 过 将 过 程 中 的 特点 与 不 同 的 能 力 等 级 相 比较 ， 可 以 用 此 模型 
中 定义 的 一 系列 过 程 和 框架 对 过 程 能 力 加 以 评估 。 


3. 实施 评估 


为 了 确保 等 级 评定 的 一 致 性 和 可 重复 性 ( 即 标准 化 )，ISO/IEC 15504 为 软件 过 程 评估 提供 
了 一 个 框架 并 为 进行 评审 提出 了 最 低 要 求 。 这 些 要 求 有 助 于 确保 评估 输出 内 在 的 一 致 性 ， 并 为 
评级 和 验证 与 要 求 的 一 致 性 提供 了 依据 。 该 部 分 以 及 与 该 部 分 有 关 的 内 容 详 细 定 义 了 实施 评估 
时 的 需要 ， 这 样 得 到 的 评估 结果 才 有 可 重复 性 、 可 信和 性 以 及 可 持续 性 。 


4. 评估 实施 指南 


通过 这 部 分 内 容 ， 可 以 指导 使 用 者 如 何 进行 软件 过 程 评估 。 这 个 具有 普通 意义 的 指导 可 适 
用 于 所 有 企业 ， 同 时 也 适用 于 采用 不 同 的 方法 、 技 术 以 及 支持 工具 的 过 程 评估 。 它 包括 如 何 选 
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择 并 使 用 兼容 的 评估 ， 如 何 选 择 用 于 支持 评估 的 方法 ， 如 何 选择 适合 于 评估 的 工具 与 手段 。 该 
部 分 内 容 对 过 程 评 估 作 了 概述 ， 并 且 以 指南 形式 对 用 于 评估 的 兼容 模型 、 文 件 化 的 评估 过 程 和 
工具 的 使 用 和 选择 等 方面 的 需求 作 了 解释 。 

5. 评估 模型 和 标志 指南 


这 部 分 内 容 为 支持 过 程 评 估 提 出 了 一 个 评估 模型 的 范例 ， 此 评估 模型 与 第 二 部 分 所 描述 的 
参考 模型 相 兼 容 ， 具 体 表述 了 任何 兼容 评估 模型 都 期 望 具有 的 核心 特征 。 该 指南 是 以 此 评估 模 
型 中 所 包含 的 指示 标志 的 形式 给 出 的 ， 这 些 指示 标志 可 在 过 程 改进 程序 中 加 以 使 用 ， 还 有 助 于 
评价 和 选择 评估 模型 、 方 法 或 工具 。 采 用 这 种 方式 并 结合 可 靠 的 方法 ， 有 可 能 对 过 程 能 力 做 出 
一 致 的 且 可 重复 的 评估 。 

6. 评估 师 能 力 指南 


这 部 分 提供 了 关于 评估 师 进 行 软件 过 程 评估 的 资格 和 准备 的 指南 。 它 详细 说 明了 一 些 可 用 
于 验证 评估 师 胜任 能 力 和 相应 的 教育 、 培 训 和 经 验 ， 还 包括 可 能 用 于 验证 胜任 能 力 和 证 实 受 教 
育 程度 、 培 训 情况 和 经 验 的 一 些 机 制 。 

7. 过 程 改进 应 用 指南 

该 部 分 提供 了 关于 使 用 软件 过 程 评估 作为 首要 方法 去 理解 一 个 企业 软件 过 程 的 当前 状态 ， 
以 及 使 用 评估 结果 去 形成 并 优化 改进 方案 方面 的 指南 。 一 个 企业 可 以 根据 它 的 具体 情况 和 需要 
从 参考 模型 中 选择 所 有 的 或 一 部 分 软件 过 程 用 于 评估 或 改进 。 

8. 确定 供 方 能 力 应 用 指南 

该 部 分 内 容 为 过 程 能 力 确 定 目的 而 进行 的 过 程 评 审 提供 应 用 指南 。 它 讲述 了 为 对 过 程 能 力 
加 以 判断 ， 应 如 何 定义 输入 和 如 何 运用 评估 结果 。 该 部 分 中 关于 过 程 能 力 的 判断 方法 不 仅 适 合 
于 任何 希望 确定 其 自身 软件 过 程 的 过 程 能 力 的 企业 ， 也 同样 适应 于 对 供应 商 的 能 力 进 行 
判断 。 

9. 词汇 


本 部 分 定义 了 ISO/IEC TR 15504 整个 技术 报告 中 使 用 的 术语 。 术 语 首先 按 字 母 排列 顺序 以 
便于 参考 ， 然 后 再 按 罗 辑 类 进行 分 类 以 便于 理解 〈 将 相互 相关 的 术语 安排 在 一 类 )。 


11.2 ”知识 产权 基础 知识 


知识 产权 〈 也 称 为 智慧 财产 权 ) 是 现代 社会 发 展 中 不 可 缺少 的 一 种 法 律 制度 。 知 识 产权 
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是 指 人 们 基于 自己 的 智力 活动 创造 的 成 果 和 经 营 管理 活动 中 的 经 验 、 知 识 而 依法 享有 的 权利 。 
我 国 《 民 法 通则 》 规 定 ， 知 识 产 权 是 指 民事 权利 主体 〈 公 民 、 法 人 ) 基于 创造 性 的 智力 成 果 。 


11.2.1 基本 概念 


根据 有 关 国 际 公约 规 定 ( 世 界 知识 产权 组 织 公约 第 二 条 )， 知 识 产 权 的 保护 对 象 包括 下 列 
各 项 有 关 权 利 。 

(1) 文学 、 艺 术 和 科学 作品 。 

(2) 表演 艺术 家 的 表演 以 及 唱片 和 广播 节目 。 

(3) 人 类 一 切 活动 领域 的 发 明 。 

(4) 科学 发 现 。 

(5) 工业 品 外 观 设 计 。 

(6) 商标 、 服 务 标记 以 及 商业 名 称 和 标志 。 

(7) 制止 不 正当 竞争 。 

(8) 在 工业 、 科 学 、 文 学 艺术 领域 内 由 于 智力 创造 活动 而 产生 的 一 切 其 他 权利 。 

在 世界 贸易 组 织 协议 的 知识 产权 协议 中 ， 第 一 部 分 第 一 条 所 规定 的 知识 产权 范围 ， 还 包括 
“未 披露 过 的 信息 专 有 权 ”， 这 主要 是 指 工商 业经 营 者 所 拥有 的 经 营 秘密 和 技术 秘密 等 商业 秘 
密 。 知 识 产 权 保护 制度 是 随 着 科学 技术 的 进步 而 不 断 发 展 和 完善 的 。 随 着 科学 技术 的 迅速 发 展 ， 
知识 产权 保护 对 象 的 范围 不 断 扩大 , 不 断 涌现 新 型 的 智力 成 果 , 如 计算 机 软件 、 生 物 工程 技术 、 
遗传 基因 技术 和 植物 新 品种 等 ， 这 些 都 是 当今 世界 各 国 所 公认 的 知识 产权 的 保护 对 象 。 知 识 产 
权 可 分 为 工业 产权 和 著作 权 两 类 。 

(1) 工业 产权 。 根 据 保 护 工业 产权 巴黎 公约 第 一 条 的 规定 ， 工 业 产权 包括 专利 、 实 用 新 型 、 
工业 品 外观 设 计 、 商 标 、 服 务 标记 、 厂 商 名 称 、 产 地 标记 或 原 产 地 名 称 、 制 止 不 正当 竞争 等 项 
内 容 。 此 外 ， 商 业 秘密 、 微 生物 技术 和 遗传 基因 技术 等 也 属于 工业 产权 保护 的 对 象 。 近 年 来 ， 
在 一 些 国家 可 以 通过 申请 专利 对 计算 机 软件 进行 专利 保护 。 对 于 工业 产权 保护 的 对 象 ， 可 以 分 
为 “创造 性 成 果 权 利 ” 和 “识别 性 标记 权利 ”。 发 明 、 实 用 新 型 和 工业 品 外 观 设计 等 属于 创造 
性 成 果 权 利 ， 它 们 都 表现 出 比较 明显 的 智力 创造 性 。 其 中 ， 发 明和 实用 新 型 是 利用 自然 规律 做 
出 的 解决 特定 问题 的 新 的 技术 方案 ， 工 业 品 外 观 设计 是 确定 工业 品 外 表 的 美学 创作 ， 完 成 人 需 
要 付出 创造 性 劳动 。 商 标 、 服 务 标记 、 厂 商 名 称 、 产 地 标记 或 原 产 地 名 称 以 及 我 国 反 不 正当 竞 
争 法 第 五 条 中 规定 的 知名 商品 所 特有 的 名 称 、 包 装 、 装 潢 等 为 识别 性 标记 权利 。 

(2) 著作 权 。 著 作 权 〈 也 称 为 版 权 ) 是 指 作者 对 其 创作 的 作品 享有 的 人 身 权 和 财产 权 。 人 
身 权 包括 发 表 权 、 署 名 权 、 修 改 权 和 保护 作品 完整 权 等 ;财产 权 包括 作品 的 使 用 权 和 获得 报酬 
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权 ， 即 以 复制 、 表 演 、 播 放 、 展 览 、 发 行 、 摄 制 电影 、 电 视 、 录 像 或 者 改编 、 翻 译 、 注 释 、 编 
辑 等 方式 使 用 作品 的 权利 ， 以 及 许可 他 人 以 上 述 方式 使 用 作品 并 由 此 获得 报酬 的 权利 。 关 于 著 
作 权 保护 的 对 象 ， 按 照 《 保 护 文学 艺术 作品 伯尔尼 公约 》 第 二 条 规定 ， 包 括 文 学 、 科 学 和 艺术 
领域 内 的 一 切 作品 ， 不 论 其 表现 形式 或 方式 如 何 ， 诸 如 书籍 、 小 册子 和 其 他 著作 ; 讲课、 演讲 
和 其 他 同类 性 质 作 品 ， 戏 剧 或 音乐 作品 ， 舞 蹈 艺术 作品 和 哑 剧 作品 ， 配 词 或 未 配 词 的 乐曲 ， 电 
影 作品 以 及 与 使 用 电影 摄影 艺术 类 似 的 方法 表现 的 作品 ， 图 画 、 油 画 、 建 筑 、 雕 塑 、 雕 刻 和 版 
画 ; 摄影 作品 以 及 使 用 与 摄影 艺术 类 似 的 方法 表现 的 作品 ;与 地 理 、 地 形 建 筑 或 科学 技术 有 关 
的 示意 图 、 地 图 、 设 计 图 、 草 图 和 立体 作品 等 。 

有 些 智力 成 果 可 以 同时 成 为 这 两 类 知识 产权 保护 的 客体 ， 例如， 计算 机 软件 和 实用 艺术 品 
受 著作 权 保 护 的 同时 ， 权 利 人 还 可 以 通过 申请 发 明 专 利和 外 观 设 计 专利 获得 专利 权 ， 成 为 工业 
产权 保护 的 对 象 。 在 美国 和 欧洲 的 一 些 国家 ， 如 果 计 算 机 软件 自身 包含 技术 构成 ， 软 件 又 能 实 
现 某 方面 的 技术 效果 ， 如 工业 自动 化 控制 等 ， 则 不 应 排除 专利 保护 。 按 照 世 界 知识 产权 组 织 公 
约 ， 科 学 发 现 也 被 列 为 知识 产权 。 我 国民 法 通则 第 九 十 七 条 规定 了 科学 发 现 权 的 法 律 地 位 ， 但 
很 难 将 其 归属 工业 产权 或 著作 权 。 可 见 ， 新 产生 的 一 些 知识 产权 不 一 定 就 归 为 这 两 个 类 别 。 


1. 知识 产权 的 特点 


(1) 无 形 性 。 知 识 产 权 是 一 种 无 形 财产 权 。 知 识 产权 的 客体 指 的 是 智力 创作 性 成 果 〈 也 称 
为 知识 产品 ) ， 是 一 种 没有 形体 的 精神 财富 。 它 是 一 种 可 以 脱离 其 所 有 者 而 存在 的 无 形 信息 ， 
可 以 同时 为 多 个 主体 所 使 用 , 在 一 定 条 件 下 不 会 因 多 个 主体 的 使 用 而 使 该 项 知识 财产 自身 遭受 
损耗 或 者 灭失 。 

(2) 双重 性 。 某 些 知识 产权 具有 财产 权 和 人 身 权 双重 性 ， 例 如 著作 权 ， 其 财产 权 属 性 主要 
体现 在 所 有 人 享有 的 独占 权 以 及 许可 他 人 使 用 而 获得 报酬 的 权利 , 所 有 人 可 以 通过 独自 实施 获 
得 收益 ， 也 可 以 通过 有 偿 许 可 他 人 实施 获得 收益 ， 还 可 以 像 有 形 财产 那样 进行 买卖 或 抵押 ; 其 
人 身 权 属性 主要 是 指 署名 权 等 。 有 的 知识 产权 具有 单一 的 属性 ， 例 如 ， 发 现 权 只 具有 名 誉 权 属 
性 ， 而 没有 财产 权 属 性 ;商业 秘密 只 具有 财产 权 属性 ， 而 没有 人 身 权 属性 ; 专利 权 、 商 标 权 主 
要 体现 为 财产 权 。 

(3) 确认 性 。 无 形 的 智力 创作 性 成 果 不 像 有 形 财产 那样 直观 可 见 ， 因 此 ， 智 力 创作 性 成 果 
的 财产 权 需 要 依法 审查 确认 ， 以 得 到 法 律 保护 。 例 如 ， 我 国 的 发 明 人 所 完成 的 发 明 ， 其 实用 新 
型 或 者 外 观 设计 ， 已 经 具有 价值 和 使 用 价值 ， 但 是 ， 其 完成 人 尚 不 能 自动 获得 专利 权 ， 完 成 人 
必须 依照 专利 法 的 有 关 规 定 ， 向 国家 专利 局 提出 专利 申请 ， 专 利 局 依照 法 定 程序 进行 审查 ， 申 
请 符合 专利 法 规定 条 件 的 ， 由 专利 局 做 出 授予 专利 权 的 决定 ， 颁 发 专利 证 书 ， 只 有 当 专利 局 发 
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布 授权 公告 后 ,其 完成 人 才 享 有 该 项 知识 产权 。 又 如 ,商标 权 的 获得 ， 大 多 数 国家 (包括 中 国 ) 
都 实行 注册 制 ， 只 有 向 国家 商标 局 提出 注册 申请 ， 经 审查 核准 注册 后 ， 才 能 获得 商标 权 。 文 学 
艺术 作品 以 及 计算 机 软件 的 著作 权 虽 然 是 自作 品 完 成 其 权利 即 自动 产生 , 但 有 些 国家 也 要 实行 
登记 或 标注 版 权 标记 后 才能 得 到 保护 。 

(4) 独占 性 。 由 于 智力 成 果 具 有 可 以 同时 被 多 个 主体 所 使 用 的 特点 ， 因 此 ， 法 律 授予 知识 
产权 一 种 专 有 权 ， 具 有 独占 性 。 未 经 权利 人 许可 , 任何 单位 或 个 人 不 得 使 用 ， 否 则 就 构成 侵权 ， 
应 承担 相应 的 法 律 责任 。 法 律 对 各 种 知识 产权 都 规定 了 一 定 的 限制 ， 但 这 些 限 制 不 影响 其 独占 
性 特征 。 少 数 知识 产权 不 具有 独占 性 特征 ， 例 如 技术 秘密 的 所 有 人 不 能 禁止 第 三 人 使 用 其 独立 
开发 完成 的 或 者 合法 取得 的 相同 技术 秘密 ， 可 以 说 ， 商 业 秘密 不 具备 完全 的 财产 权 属性 。 

(5) 地 域 性 。 知 识 产权 具有 严格 的 地 域 性 特点 ， 即 各 国 主管 机 关 依照 本 国法 律 授 予 的 知识 
产权 ， 只 能 在 其 本 国 领域 内 受 法 律 保 护 ， 例 如 中 国 专利 局 授予 的 专利 权 或 中 国 商 标 局 核准 的 商 
标 专用 权 ， 只 能 在 中 国 领域 内 受 保护 ， 其 他 国家 则 不 给 予 保护 ， 外 国人 在 我 国 领域 外 使 用 中 国 
专利 局 授权 的 发 明 专 利 ， 不 侵犯 我 国 专利 权 。 所 以 ， 我 国 公民 、 法 人 完成 的 发 明 创造 要 想 在 外 
国 受 保护 ， 必 须 在 外 国 申 请 专利 。 著 作 权 虽 然 自动 产生 ， 但 它 受 地 域 限制 ， 我 国法 律 对 外 国人 
的 作品 并 不 都 给 予 保护 ， 只 保护 共同 参加 国际 条 约 国 家 的 公民 作品 。 同 样 ， 公 约 的 其 他 成 员 国 
也 按照 公约 规定 ， 对 我 国 公民 和 法 人 的 作品 给 予 保护 。 还 有 按照 两 国 的 双边 协定 ， 相 互 给 予 对 
方 国民 的 作品 保护 。 

(6) 时 间 性 。 知 识 产 权 具 有 法 定 的 保护 期 限 ， 一 旦 保护 期 限 届满 ， 权 利 将 自行 终止 ， 成 为 
社会 公众 可 以 自由 使 用 的 知识 。 至 于 期 限 的 长 短 ， 依 各 国 的 法 律 确定 。 例 如 ， 我 国 发 明 专 利 的 
保护 期 为 20 年 ， 实 用 新 型 专利 权 和 外 观 设计 专利 权 的 期 限 为 10 年 , 均 自 专利 申请 日 起 计算 。 我 
国 公民 的 作品 发 表 权 的 保护 期 为 作者 终生 及 其 死亡 后 50 年 。 我 国 商标 权 的 保护 期 限 自 核准 注册 
之 日 起 10 年 内 有 效 ， 但 可 以 根据 其 所 有 人 的 需要 无 限 地 延长 权利 期 限 ， 在 期 限 届满 前 6 个 月 内 
申请 续 展 注册 ， 每 次 续 展 注册 的 有 效 期 为 10 年 ， 续 展 注册 的 次 数 不 限 。 如 果 商 标 权 人 和 逾期 不 办 
理 续 展 注册 ， 其 商标 权 也 将 终止 。 商 业 秘 密 受 法 律 保 护 的 期 限 是 不 确定 的 ， 该 秘密 一 旦 被 公众 
所 知悉 ， 即 成 为 公众 可 以 自由 使 用 的 知识 。 

2. 中 国 知识 产权 法 规 

目前 ， 我 国 已 形成 了 比较 完备 的 知识 产权 保护 的 法 律 体 系 ， 保 护 知识 产权 的 法 律 主要 有 中 
华人 民 共 和 国 著 作 权 法 、 中 华人 民 共 和 国 专 利 法 、 中 华人 民 共 和 国 继承 法 、 中 华人 民 共 和 国 公 
司法 、 中 华人 民 共 和 国 合同 法 、 中 华人 民 共和 国 商标 法 、 中 华人 民 共 和 国产 品质 量 法 、 中 华人 
民 共 和 国 反 不 正当 竞争 法 、 中 华人 民 共和 国 刑法 、 中 华人 民 共 和 国 计 算 机 信息 系统 安全 保护 条 


加 >" 医 


图 5S9 若 。 钦 作 设计 师 教程 (第 5 版 ) 


例 、 中 华人 民 共 和 国 计 算 机 软件 保护 条 例 和 中 华人 民 共和 国 著作 权 法 实施 条 例 等 。 
11.2.2 计算 机 软件 著作 权 


1. 计算 机 软件 著作 权 的 主体 与 客体 


1) 计算 机 软件 著作 权 的 主体 

计算 机 软件 著作 权 的 主体 是 指 享有 著作 权 的 人 。 根 据 著作 权 法 和 《计算 机 软件 保护 条 例 》 
的 规定 ， 计 算 机 软件 著作 权 的 主体 包括 公民 、 法 人 和 其 他 组 织 。 著 作 权 法 和 《计算 机 软件 保护 
条 例 》 未 规定 对 主体 的 行为 能 力 限制 ， 同 时 对 外 国人 、 无 国籍 人 的 主体 资格 ， 奉 行 “ 有 条 件 ” 
的 国民 待遇 原则 。 

(1) 公民 。 公 民 《〈 即 指 自 然 人 ) 通过 以 下 途径 取得 软件 著作 权 主 体 资格 。 

Q@ 公民 自行 独立 开发 软件 (软件 开发 者 )。 

@ 订立 委托 合同 ， 委 托 他 人 开发 软件 ， 并 约定 软件 著作 权 归 自己 享有 。 

@ 通过 转让 途径 取得 软件 著作 财产 权 主 体 资格 〈 软 件 权利 的 受 让 者 )。 

@ 公民 之 间或 与 其 他 主体 之 间 ， 对 计算 机 软件 进行 合作 开发 而 产生 的 公民 群体 或 者 公民 
与 其 他 主体 成 为 计算 机 软件 作品 的 著作 权 人 。 

@@ 根据 《继承 法 》 的 规定 ， 通 过 继承 取得 软件 著作 财产 权 主 体 资格 。 

(2) 法 人 。 法 人 是 具有 民事 权利 能 力 和 民事 行为 能 力 ， 依 法 独立 享有 民事 权利 和 承担 义务 
的 组 织 。 计 算 机 软件 的 开发 往往 需要 较 大 投资 和 较 多 的 人 员 ， 法 人 则 具有 资金 来 源 丰 富 和 科技 
人 才 众多 的 优势 ， 因 而 法 人 是 计算 机 软件 著作 权 的 重要 主体 。 法 人 取得 计算 机 软件 著作 权 主 体 
资格 一 般 通 过 以 下 途径 。 

@ 由 法 人 组 织 并 提供 创作 物质 条 件 所 实施 的 开发 ， 并 由 法 人 承担 社会 责任 。 

@ 通过 接受 委托 、 转 让 等 各 种 有 效 合同 关系 而 取得 著作 权 主 体 资格 。 

@ 因 计 算 机 软件 著作 权 主 体 ( 法 人 ) 发 生变 更 而 依法 成 为 著作 权 主 体 。 

(3) 其 他 组 织 。 其 他 组 织 是 指 除 去 法 人 以 外 的 能 够 取得 计算 机 软件 著作 权 的 其 他 民事 主体 ， 
包括 非法 人 单位 、 合 作 伙伴 等 。 

2) 计算 机 软件 著作 权 的 客体 

计算 机 软件 著作 权 的 客体 是 指 著 作 权 法 保护 的 计算 机 软件 著作 权 的 范围 ( 受 保护 的 对 象 ) 。 
根据 《著作 权 法 》 第 三 条 和 《计算 机 软件 保护 条 例 》 第 二 条 的 规定 ， 著 作 权 法 保护 的 计算 机 软 
件 是 指 计算 机 程序 及 其 有 关 文档 。 著 作 权 法 对 计算 机 软件 的 保护 是 指 计算 机 软件 的 著作 权 人 或 
者 其 受 让 者 依法 享有 著作 权 的 各 项 权利 。 
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(1) 计算 机 程序 。《 根 据 计算 机 软件 保护 条 例 》 第 三 条 第 一 款 的 规定 ， 计 算 机 程序 是 指 为 
了 得 到 某 种 结果 而 可 以 由 计算 机 等 具有 信息 处 理 能 力 的 装置 执行 的 代码 化 指令 序列 , 或 者 可 被 
自动 转换 成 代码 化 指令 序列 的 符号 化 语句 序列 。 计 算 机 程序 包括 源 程 序 和 目标 程序 ， 同 一 程序 
的 源 程序 文本 和 目标 程序 文本 视 为 同一 软件 作品 。 

(2) 计算 机 软件 的 文档 。 根 据 《 计 算 机 软件 保护 条 例 》 第 三 条 第 二 款 的 规定 ， 计 算 机 程序 
的 文档 是 指 用 自然 语言 或 者 形式 化 语言 所 编写 的 文字 资料 和 图 表 , 用 来 描述 程序 的 内 容 、 组 成 、 
设计 、 功 能 规格 、 开 发 情况 、 测 试 结果 及 使 用 方法 等 。 文 档 一 般 以 程序 设计 说 明 书 、 流 程 图 和 
用 户 手册 等 表现 。 


2. 计算 机 软件 受 著作 权 法 保护 的 条 件 


《计算 机 软件 保护 条 例 》 规 定 ， 依 法 受到 保护 的 计算 机 软件 作品 必须 符合 下 列 条 件 。 

(1) 独立 创作 。 受 保护 的 软件 必须 由 开发 者 独立 开发 创作 ， 任 何 复制 或 抄袭 他 人 开发 的 软 
件 都 不 能 获得 著作 权 。 当 然 ， 软 件 的 独创 性 不 同 于 专利 的 创造 性 。 程 序 的 功能 设计 往往 被 认为 
是 程序 的 思想 概念 ， 根 据 著作 权 法 不 保护 思想 概念 的 原则 ， 任 何人 都 可 以 设计 具有 类 似 功 能 的 
另 一 件 软件 作品 。 但 是 ， 如 果 用 了 他 人 软件 作品 的 逻辑 步骤 的 组 合 方式 ， 则 对 他 人 软件 构成 侵权 。 

(2) 可 被 感知 。 受 著作 权 法 保护 的 作品 应 当 是 作者 创作 思想 在 固定 载体 上 的 一 种 实际 表达 。 
如 果 作 者 的 创作 思想 未 表达 出 来 不 可 以 被 感知 ， 就 不 能 得 到 著作 权 法 的 保护 。 因 此 ，《 计 算 机 
软件 保护 条 例 》 规 定 ， 受 保护 的 软件 必须 固定 在 某 种 有 形 物体 上 ， 例 如 固定 在 存储 器 、 磁 盘 和 
磁带 等 设备 上 ， 也 可 以 是 其 他 的 有 形 物 ， 如 纸张 等 。 

(3) 多 辑 合 理 。 由 辑 判断 功能 是 计算 机 系统 的 基本 功能 。 因 此 ， 受 著作 权 法 保护 的 计算 机 
软件 作品 必须 具备 合理 的 逻辑 思想 , 并 以 正确 的 旭 辑 步骤 表现 出 来 , 才能 达到 软件 的 设计 功能 。 

根据 《计算 机 软件 保护 条 例 》 第 六 条 的 规定 ， 除 计算 机 软件 的 程序 和 文档 外 ， 著 作 权 法 不 
保护 计算 机 软件 开发 所 用 的 思想 、 概 念 、 发 现 、 原 理 、 算 法 、 处 理 过 程 和 运算 方法 。 也 就 是 说 ， 
利用 已 有 的 上 述 内 容 开 发 软件 ， 并 不 构成 侵权 。 因 为 开发 软件 时 所 采用 的 思想 、 概 念 等 均 属 计 
算 机 软件 基本 理论 的 范围 ， 是 设计 开发 软件 不 可 或 缺 的 理论 依据 ， 属 于 社会 公有 领域 ， 不 能 被 
个 人 专 有 。 


3. 计算 机 软件 著作 权 的 权利 


1) 计算 机 软件 的 著作 人 身 权 

《中 华人 民 共 和 国 著 作 权 法 》 规 定 ， 软 件 作 品 享有 两 类 权利 ， 一 类 是 软件 著作 权 的 人 身 权 
(精神 权利 ) ; 另 一 类 是 软件 著作 权 的 财产 权 经 济 权利 ) 。《 计 算 机 软件 保护 条 例 》 规 定 ， 
软件 著作 权 人 享有 发 表 权 和 开发 者 身份 权 ， 这 两 项 权利 与 软件 著作 权 人 的 人 身 权 是 不 可 分 
离 的 。 


so 
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(1) 发 表 权 。 发 表 权 是 指 决定 软件 作品 是 否 公之于众 的 权利 ， 即 指 软件 作品 完成 后 ， 以 复 
制 、 展 示 、 发 行 或 者 翻译 等 方式 使 软件 作品 在 一 定数 量 不 特定 人 的 范围 内 公开 。 发 表 权 具体 内 
容 包 括 软件 作品 发 表 的 时 间 、 发 表 的 形式 以 及 发 表 的 地 点 等 。 

(2) 开发 者 身份 权 〈 也 称 为 署名 权 )。 开 发 者 身份 权 是 指 作者 为 表明 身份 在 软件 作品 中 署 
自己 名 字 的 权利 。 署 名 可 有 多 种 形式 ， 既 可 以 署 作者 的 姓名 ， 也 可 以 署 作者 的 笔名 ， 或 者 作者 
自愿 不 署名 。 对 于 一 部 作品 来 说 ， 通 过 署名 即 可 对 作者 的 身份 给 予 确认 。 我 国 著作 权 法 规定 ， 
如 无 相反 证 明 ， 在 作品 上 署名 的 公民 、 法 人 或 非法 人 单位 为 作者 。 因 此 ， 作 品 的 署名 对 确认 著 
作 权 的 主体 具有 重要 意义 。 开 发 者 的 身份 权 不 随 软件 开发 者 的 消亡 而 丧失 ， 且 无 时 间 限 制 。 

2) 计算 机 软件 的 著作 财产 权 

著作 权 中 的 财产 权 是 指 能 够 给 著作 权 人 带 来 经 济 利益 的 权利 。 财 产权 通常 是 指 由 软件 著作 
权 人 控制 和 支配 ， 并 能 够 为 权利 人 带 来 一 定 经 济 效益 的 权利 。《 计 算 机 软件 保护 条 例 》 规 定 ， 
软件 著作 权 人 享有 下 述 软件 财产 权 。 

(1) 使 用 权 。 即 在 不 损害 社会 公共 利益 的 前 提 下 ， 以 复制 、 修 改 、 发 行 、 翻 译 和 注释 等 
方式 合作 软件 的 权利 。 

(2) 复制 权 。 即 将 软件 作品 制作 一 份 或 多 份 的 行为 。 复 制 权 就 是 版 权 所 有 人 决定 实施 或 
不 实施 上 述 复制 行为 或 者 禁止 他 人 复制 其 受 保护 作品 的 权利 。 

(3) 修改 权 。 即 对 软件 进行 增补 、 删 节 ， 或 者 改变 指令 、 语 句 顺序 等 以 提高 、 完 善 原 软 
件 作品 的 做 法 。 修 改 权 即 指 作 者 享有 的 修改 或 者 授权 他 人 修改 软件 作品 的 权利 。 

(4) 发 行 权 。 发 行 是 指 为 满足 公众 的 合理 需求 ， 通 过 出 售 、 出 租 等 方式 向 公众 提供 一 定 
数量 的 作品 复制 件 。 发 行 权 即 以 出 售 或 赠与 方式 向 公众 提供 软件 的 原件 或 者 复制 件 的 权利 。 

(5) 翻译 权 。 翻 译 是 指 以 不 同 于 原 软件 作品 的 一 种 程序 语言 转换 该 作品 原 使 用 的 程序 语 
言 ， 而 重 现 软件 作品 内 容 的 创作 。 简 单 地 说 ， 也 就 是 指 将 原 软件 从 一 种 程序 语言 转换 成 男 一 种 
程序 语言 的 权利 。 

(6) 注释 权 。 软 件 作品 的 注释 是 指 对 软件 作品 中 的 程序 语句 进行 解释 ， 以 便 更 好 地 理解 
软件 作品 。 注 释 权 是 指 著 作 权 人 对 自己 的 作品 享有 进行 注释 的 权利 。 

(7) 信息 网 络 传播 权 。 以 有 线 或 者 无 线 信息 网 络 方式 向 公众 提供 软件 作品 ， 使 公众 可 在 
其 个 人 选 定 的 时 间 和 地 点 获得 软件 作品 的 权利 。 

(8) 出 租 权 。 即 有 偿 许 可 他 人 临时 使 用 计算 机 软件 的 复制 件 的 权利 ， 但 是 软件 不 是 出 租 
的 主要 标的 的 除外 。 

(9) 使 用 许可 权 和 获得 报酬 权 。 即 许可 他 人 以 上 述 方式 使 用 软件 作品 的 权利 (许可 他 人 
行使 软件 著作 权 中 的 财产 权 ) 和 依照 约定 或 者 有 关 法 律 规 定 获得 报酬 的 权利 。 

(10) 转让 权 。 即 向 他 人 转让 软件 的 使 用 权 和 使 用 许可 权 的 权利 。 软 件 著作 权 人 可 以 全 部 
或 者 部 分 转让 软件 著作 权 中 的 财产 权 。 
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3) 软件 合法 持 有 人 的 权利 

根据 《计算 机 软件 保护 条 例 》 的 规定 ， 软 件 的 合法 复制 品 所 有 人 享有 下 述 权利 。 

(1) 根据 使 用 的 需要 把 软件 装 入 计算 机 等 能 存储 信息 的 装置 内 。 

(2) 根据 需要 进行 必要 的 复制 。 

(3) 为 了 防止 复制 品 损坏 而 制作 备份 复制 品 。 这 些 复制 品 不 得 通过 任何 方式 提供 给 他 人 使 
用 ， 并 在 所 有 人 形 失 该 合法 复制 品 所 有 权时 ， 负 责 将 备份 复制 品 销毁 。 

(4) 为 了 把 该 软件 用 于 实际 的 计算 机 应 用 环境 或 者 改进 其 功能 性 能 而 进行 必要 的 修改 。 但 
是 ， 除 合同 约定 外 ， 未 经 该 软件 著作 权 人 许可 ， 不 得 向 任何 第 三 方 提供 修改 后 的 软件 。 


4. 计算 机 软件 著作 权 的 行使 


1) 软件 经 济 权利 的 许可 使 用 

软件 经 济 权利 的 许可 使 用 是 指 软件 著作 权 人 或 权利 合法 受 让 者 , 通过 合同 方式 许可 他 人 使 
用 其 软件 ， 并 获得 报酬 的 一 种 软件 贸易 形式 。 许 可 使 用 的 方式 可 分 为 以 下 几 种 。 

(1) 独占 许可 使 用 。 权 利 人 通过 书面 合同 授权 ， 被 授权 方 可 以 根据 合同 规定 的 方式 、 条 
件 和 时 间 确 定 独占 性 ， 权 利 人 不 得 将 软件 使 用 权 授 予 第 三 方 ， 权 利 人 自己 不 能 使 用 该 软件 。 

(2) 独家 许可 使 有 用。 权利 人 通过 书面 合同 授权 ， 被 授权 方 可 以 根据 合同 规定 的 方式 、 条 
件 和 时 间 确 定 独占 性 ， 权 利 人 不 得 将 软件 使 用 权 授予 第 三 方 ， 权 利 人 自己 可 以 使 用 该 软件 。 

(3) 普通 许可 使 用 。 权 利 人 通过 书面 合同 授权 ， 被 授权 方 可 以 根据 合同 规定 的 方式 、 条 
件 和 时 间 确 定 独占 性 ， 权 利 人 可 以 将 软件 使 用 权 授予 第 三 方 ， 权 利 人 自己 可 以 使 用 该 软件 。 

(4) 法 定 许可 使 用 和 强制 许可 使 用 。 在 法 律 特定 的 条 款 下 ， 不 经 软件 著作 权 人 许可 ， 
用 其 软件 。 

2) 软件 经 济 权利 的 转让 使 用 

软件 经 济 权利 的 转让 使 用 是 指 软 件 著作 权 人 将 其 享有 的 软件 著作 权 中 的 经 济 权利 全 部 转 
移 给 他 人 。 软 件 经 济 权 利 的 转让 将 改变 软件 权利 的 归属 ， 原 始 著作 权 人 的 主体 地 位 随 着 转让 活 
动 的 发 生 而 丧失 ， 软 件 著作 权 受 让 者 成 为 新 的 著作 权 主 体 。《 计 算 机 软件 保护 条 例 》 规 定 ， 软 
件 著作 权 转 让 必须 签订 书面 合同 。 同 时 ， 软 件 转让 活动 不 能 改变 软件 的 保护 期 。 转 让 方式 包括 
出 买 、 赠 与 、 抵 押 和 赔偿 等 ， 可 以 定期 转让 或 者 永久 转让 。 


S. 计算 机 软件 著作 权 的 保护 期 


根据 《著作 权 法 》 和 《计算 机 软件 保护 条 例 》 的 规定 ， 计 算 机 软件 著作 权 的 权利 自 软件 开 
发 完成 之 日 起 产生 ， 保 护 期 为 50 年 。 保 护 期 满 ， 除 开发 者 身份 权 以 外 ， 其 他 权利 终止 。 一 旦 
计算 机 软件 著作 权 超 出 保护 期 ， 软 件 就 进入 公有 领域 。 计 算 机 软件 著作 权 人 的 单位 终止 和 计算 
机 软件 著作 权 人 的 公民 死亡 均 无 合法 继承 人 时 ， 除 开发 者 身份 权 以 外 ， 该 软件 的 其 他 权利 进入 


二 


使 


EA 


国 5%6 若 。 软 人 设计 师 教程 (第 5 版) 


公有 领域 。 软 件 进入 公有 领域 后 成 为 社会 公共 财富 ， 公 众 可 无 偿 使 用 。 
6. 计算 机 软件 著作 权 的 归属 


我 国 著作 权 法 对 著作 权 的 归属 采取 了 “创作 主义 ”原则 ， 明 确 规定 著作 权 属 于 作者 ， 除 非 
另 有 规定 。《 计 算 机 软件 保护 条 例 》 第 九条 规定 “软件 著作 权 属于 软件 开发 者 ， 本 条 例 另 有 规 
定 的 情况 除外 。” 这 是 我 国 计 算 机 软件 著作 权 归 属 的 基本 原则 。 

计算 机 软件 开发 者 是 计算 机 软件 著作 权 的 原始 主体 ， 也 是 享有 权利 最 完整 的 主体 。 软 件 作 
品 是 开发 者 从 事 智力 创作 活动 所 取得 的 智力 成 果 ， 是 脑力 劳动 的 结晶 。 其 开发 创作 行为 使 开发 
者 直接 取得 该 计算 机 软件 的 著作 权 。 因 此 , 《计算机 软件 保护 条 例 》 第 九条 明确 规定 “软件 著 
作 权 属于 软件 开发 者 ” 即 以 软件 开发 的 事实 来 确定 著作 权 的 归属 ， 谁 完成 了 计算 机 软件 的 
发 工作 ， 软 件 的 著作 权 就 归 谁 享有 。 

1) 职务 开发 软件 著作 权 的 归属 

职务 软件 作品 是 指 公 民 在 单位 任职 期 间 为 执行 本 单位 工作 任务 所 开发 的 计算 机 软件 作品 。 
《计算 机 软件 保护 条 例 》 第 十 三 条 做 出 了 明确 的 规定 ， 即 公民 在 单位 任职 期 间 所 开发 的 软件 ， 
如 果 是 执行 本 职工 作 的 结果 ， 即 针对 本 职工 作 中 明确 指定 的 开发 目标 所 开发 的 ， 或 者 是 从 事 本 
职工 作 活 动 所 预见 的 结果 或 自然 的 结果 ; 则 该 软件 的 著作 权 属 于 该 单位 。 根 据 《计算 机 软件 保 
护 条 例 》 规 定 ， 可 以 得 出 这 样 的 结论 : 当 公民 作为 某 单 位 的 雇员 时 ， 如 其 开发 的 软件 属于 执行 
本 职工 作 的 结果 ， 该 软件 著作 权 应 当归 单位 享有 。 若 开发 的 软件 不 是 执行 本 职工 作 的 结果 ， 其 
著作 权 就 不 属 单位 享有 。 如 果 该 雇员 主要 使 用 了 单位 的 设备 ， 按 照 《 计 算 机 软件 保护 条 例 》 第 
十 三 条 第 三 款 的 规定 ， 不 能 属于 该 雇员 个 人 享有 。 

对 于 公民 在 非 职务 期 间 创作 的 计算 机 程序 ， 其 著作 权 属于 某 项 软件 作品 的 开发 单位 ， 还 是 
从 事 直接 创作 开发 软件 作品 的 个 人 ， 可 按照 《计算 机 软件 保护 条 例 》 第 十 三 条 规定 的 三 条 标准 
确定 。 

(1) 所 开发 的 软件 作品 不 是 执行 其 本 职工 作 的 结果 。 任 何 受 雇 于 一 个 单位 的 人 员 ， 都 会 被 
安排 在 一 定 的 工作 岗位 和 分 派 相应 的 工作 任务 ， 完 成 分 派 的 工作 任务 就 是 他 的 本 职工 作 。 本 职 
工作 的 直接 成 果 也 就 是 其 工作 任务 的 不 断 完 成 。 当 然 ， 具 体 工 作成 果 又 会 产生 许多 效益 、 产 生 
范围 更 广 的 结果 。 但 是 ， 该 条 标准 指 的 是 雇员 本 职工 作 最 直接 的 成 果 。 若 雇员 开发 创作 的 软件 
不 是 执行 本 职工 作 的 结果 ， 则 构成 非 职务 计算 机 软件 著作 权 的 条 件 之 一 。 

(2) 开发 的 软件 作品 与 开发 者 在 单位 中 从 事 的 工作 内 容 无 直接 联系 。 如 果 该 雇员 在 单位 担 
任 软件 开发 工作 ， 引 起 争议 的 软件 作品 不 能 与 其 本 职工 作 中 明确 指定 的 开发 目标 有 关 ， 软 件 作 
品 的 内 容 也 不 能 与 其 本 职工 作 所 开发 的 软件 的 功能 、 风 辑 思 维和 重要 数据 有 关 。 雇 员 所 开发 的 
软件 作品 与 其 本 职工 作 没 有 直接 的 关系 ， 则 构成 非 职务 计算 机 软件 著作 权 的 第 二 个 条 件 。 

(3) 开发 的 软件 作品 未 使 用 单位 的 物质 技术 条 件 。 开 发 创作 软件 作品 所 使 用 的 物质 技术 条 
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件 ， 即 开发 软件 作品 所 必须 的 设备 、 数 据 、 资 金 和 其 他 软件 开发 环境 ， 不 属于 雇员 所 在 的 单位 
所 有 。 没 有 使 用 受 雇 单位 的 任何 物质 技术 条 件 构成 非 职务 软件 著作 权 的 第 三 个 条 件 。 

雇员 进行 本 职工 作 以 外 的 软件 开发 创作 ， 必 须 同 时 符合 上 述 3 个 条 件 ， 才 能 算是 非 职务 软 
件 作 品 ， 雇 员 个 人 才 享 有 软件 著作 权 。 常 有 软件 开发 符合 前 两 个 条 件 ， 但 使 用 了 单位 的 技术 情 
报 资料 、 计 算 机 设备 等 物质 技术 条 件 的 情况 。 处 理 此 种 情况 较 好 的 方法 是 对 该 软件 著作 权 的 归 
属 应 当 由 单位 和 雇员 双方 协商 确定 ， 如 对 于 公民 在 非 职务 期 间 利用 单位 物质 条 件 创作 的 与 单位 
业务 范围 无 关 的 计算 机 程序 ， 其 著作 权 属于 创作 程序 的 作者 ， 但 作者 许可 第 三 人 使 用 软件 时 
应 当 支付 单位 合理 的 物质 条 件 使 用 费 ， 如 计算 机 机 时 费 等 。 若 通过 协商 不 能 解决 ， 按 上 述 三 条 
标准 做 出 界定 。 

2) 合作 开发 软件 著作 权 的 归属 

合作 开发 软件 是 指 两 个 或 两 个 以 上 公民 、 法 人 或 其 他 组 织 订立 协议 , 共同 参加 某 项 计算 机 
软件 的 开发 并 分 享 软件 著作 权 的 形式 。《 计 算 机 软件 保护 条 例 》 第 十 条 规定 : “由 两 个 以 上 的 
自然 人 、 法 人 或 者 其 他 组 织 合作 开发 的 软件 , 其 著作 权 的 归属 由 合作 开发 者 签订 书面 合同 约定 。 
无 书面 合同 或 者 合同 未 作 明确 约定 ， 合 作 开发 的 软件 可 以 分 割 使 用 的 ， 开 发 者 对 各 自 开发 的 部 
分 可 以 单独 享有 著作 权 ; 但 是 ， 行 使 著作 权时 ， 不 得 扩展 到 合作 开发 的 软件 整体 的 著作 权 。 合 
作 开 发 的 软件 不 能 分 割 使 用 的 ， 其 著作 权 由 合作 开发 者 共同 享有 ， 通 过 协商 一 致 行使 ， 如 不 能 
协商 一 致 ， 又 无 正当 理由 ， 任 何 一 方 不 得 阻止 他 方 行使 除 转让 权 以 外 的 其 他 权利 ， 但 是 所 得 收 
益 应 合理 分 配给 所 有 合作 开发 者 。” 根 据 此 规定 ， 对 合作 开发 软件 著作 权 的 归属 应 掌握 以 下 4 点 。 

(1) 由 两 个 以 上 的 单位 、 公 民 共 同 开 发 完成 的 软件 属于 合作 开发 的 软件 。 对 于 合作 开发 的 
软件 ， 其 著作 权 的 归属 一 般 是 由 各 合作 开发 者 共同 享有 ; 但 如 果 有 软件 著作 权 的 协议 ， 则 按照 
协议 确定 软件 著作 权 的 归属 。 

(2) 由 于 合作 开发 软件 著作 权 是 由 两 个 以 上 单位 或 者 个 人 共同 享有 ， 因 而 为 了 避免 在 软件 
著作 权 的 行使 中 产生 纠纷 ， 规 定 “ 合 作 开发 的 软件 ， 其 著作 权 的 归属 由 合作 开发 者 签订 书面 合 
同 约定 。” 

(3) 对 于 合作 开发 的 软件 著作 权 按 以 下 规定 执行 : “无 书面 合同 或 者 合同 未 作 明 确 约 定 ， 
合作 开发 的 软件 可 以 分 割 使 用 的 ， 开 发 者 对 各 自 开 发 的 部 分 可 以 单独 享有 著作 权 ; 但 是 ， 行 使 
著作 权时 ， 不 得 扩展 到 合作 开发 的 软件 整体 的 著作 权 。 合 作 开发 的 软件 不 能 分 割 使 用 的 ， 其 著 
作 权 由 合作 开发 者 共同 享有 ， 通 过 协商 一 致 行使 ， 如 不 能 协商 一 致 ， 又 无 正当 理由 ， 任 何 一 方 
不 得 阻止 他 方 行使 除 转让 权 以 外 的 其 他 权利 ， 但 是 所 得 收益 应 合理 分 配给 所 有 合作 开发 者 。” 

(4) 合作 开发 者 对 于 软件 著作 权 中 的 转让 权 不 得 单独 行使 。 因 为 转让 权 的 行使 将 涉及 软件 
著作 权 权 利 主体 的 改变 ， 亡 以 软件 的 合作 开发 者 在 行使 转让 权时 ， 必 须 与 各 合作 开发 者 协商 ， 
在 征 得 同意 的 情况 下 方 能 行使 该 项 专 有 权利 。 

3) 委托 开发 的 软件 著作 权 归 属 

委托 开发 的 软件 作品 属于 著作 权 法 规定 的 委托 软件 作品 。 委 托 开发 软件 作品 著作 权 关 系 的 
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建立 ， 一 般 由 委托 方 与 受 委托 方 订立 合同 而 成 立 。 委 托 开发 软件 作品 关系 中 ， 委 托 方 的 责任 主 
要 是 提供 资金 、 设 备 等 物质 条 件 ， 并 不 直接 参与 开发 软件 作品 的 创作 开发 活动 。 受 托 方 的 主要 
责任 是 根据 委托 合同 规定 的 目标 开发 出 符合 条 件 的 软件 。 关 于 委托 开发 软件 著作 权 的 归属 ， 
《计算 机 软件 保护 条 例 》 第 十 一 条 规定 : “接受 他 人 委托 开发 的 软件 ， 其 著作 权 的 归属 由 委托 
者 与 受 委托 者 签订 书面 合同 约定 ; 无 书面 合同 或 者 合同 未 作 明 确 约 定 的， 其 著作 权 由 受托 人 享 
有 。” 根 据 该 条 的 规定 ， 委 托 开发 的 软件 著作 权 的 归属 按 以 下 标准 确定 。 

(1) 委托 开发 软件 作品 需 根 据 委 托 方 的 要 求 ， 由 委托 方 与 受托 方 以 合同 确定 的 权利 和 义务 
的 关系 而 进行 开发 的 软件 。 因此, 软件 作品 著作 权 归 属 应 当 作为 合同 的 重要 条 款 予 以 明确 约定 。 
对 于 当事人 已 经 在 合同 中 约定 软件 著作 权 归 属 关系 的 ， 如 事后 发 生 纠 纷 ， 软 件 著作 权 的 归属 仍 
应 当 根 据 委托 开发 软件 的 合同 来 确定 。 

(2) 若 在 委托 开发 软件 活动 中 ， 委 托 者 与 受 委托 者 没有 签订 书面 协议 ， 或 者 在 协议 中 未 对 
软件 著作 权 归 属 作出 明确 的 约定 , 则 软件 著作 权 属 于 受 委 托 者 , 即 属于 实际 完成 软件 的 开发 者 。 

4) 接受 任务 开发 的 软件 著作 权 归 属 

根据 社会 经 济 发 展 的 需要 ， 对 于 一 些 涉及 国家 基础 项 目 或 者 重点 设施 的 计算 机 软件 ,往往 
采取 由 政府 有 关 部 门 或 上 级 单位 下 达 任务 方式 , 完成 软件 的 开发 工作 。《 计 算 机 软件 保护 条 例 》 
第 十 二 条 作出 了 明确 的 规定 : “由 国家 机 关 下 达 任务 开发 的 软件 ， 著 作 权 的 归属 与 行使 由 项 目 
任务 书 或 者 合同 规定 ; 项 目 任务 书 或 者 合同 中 未 作 明确 规定 ， 软 件 著作 权 由 接受 任务 的 法 人 或 
者 其 他 组 织 享 有 。?” 

5) 计算 机 软件 著作 权 主体 变更 后 软件 著作 权 的 归属 

计算 机 软件 著作 权 的 主体 ， 因 一 定 的 法 律 事实 而 发 生变 更 ， 如 作为 软件 著作 权 人 的 公民 的 
死亡 ， 单 位 的 变更 ， 软 件 著 作 权 的 转让 以 及 人 民法 院 对 软件 著作 权 的 归属 作出 裁判 等 。 软 件 著 
作 权 主体 的 变更 必然 引起 软件 著作 权 归 属 的 变化 。 

对 此 ，《 计 算 机 软件 保护 条 例 》 也 作 了 一 些 规定 。 因 计算 机 软件 主体 变更 引起 的 权 属 变化 
有 以 下 几 种 。 

(1) 公民 继承 的 软件 权利 归属 。《 计 算 机 软件 保护 条 例 》 第 十 五 条 规定 : “在 软件 著作 权 
的 保护 期 内 ， 软 件 著作 权 的 继承 者 可 根据 《中 华人 民 共 和 国 继承 法 》 的 有 关 规 定 ， 继 承 本 条 例 
第 八条 项 规定 的 除 署名 权 以 外 的 其 他 权利 。” 按 照 该 条 的 规定 ， 软 件 著作 权 的 合法 继承 人 依法 
享有 继承 被 继承 人 享有 的 软件 著作 权 的 使 用 权 、 使 用 许可 权 和 获得 报酬 权 等 权利 。 继承权 的 取 
得 、 继 承 顺 序 等 均 按照 继承 法 的 规定 进行 。 

(2) 单位 变更 后 软件 权利 归属 。《 计 算 机 软件 保护 条 例 》 第 十 五 条 规定 : “软件 著作 权 属 
于 法 人 或 其 他 组 织 的 ， 法 人 或 其 他 组 织 变更 、 终 止 后 ， 其 著作 权 在 本 条 例 规 定 的 保护 期 内 由 承 
受 其 权利 义务 的 法 人 或 其 他 组 织 享有 。” 按 照 该 条 的 规定 ， 作 为 软件 著作 权 人 的 单位 发 生变 更 
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《如 单位 的 合并 、 破 产 等 》， 而 其 享有 的 软件 著作 权 仍 处 在 法 定 的 保护 期 限 内 ， 可 以 由 合法 的 
权利 承受 单位 享有 原始 著作 权 人 所 享有 的 各 项 权利 。 依 法 承受 软件 著作 权 的 单位 ， 成 为 该 软件 
的 后 续 著 作 权 人 ， 可 在 法 定 的 条 件 下 行使 所 承受 的 各 项 专 有 权利 。 一 般 认 为 ，“ 各 项 权利 ” 包 
括 署名 权 等 著作 人 身 权 在 内 的 全 部 权利 。 

(3) 权利 转让 后 软件 著作 权 归 属 。《 计 算 机 软件 保护 条 例 》 第 二 十 条 规定 : “转让 软件 著 
作 权 的 ， 当 事 人 应 当 订 立 书面 合同 。” 计 算 机 软件 著作 财产 权 按 照 该 条 的 规定 发 生 转 让 后 ， 必 
然 引 起 著作 权 主体 的 变化 ， 产 生 新 的 软件 著作 权 归 属 关 系 。 软 件 权利 的 转让 应 当 根 据 我 国有 关 
法 规 以 签订 、 执 行书 面 合同 的 方式 进行 。 软 件 权 利 的 受 让 者 可 依法 行使 其 享有 的 权利 。 

(4) 司法 判决 、 裁 定 引起 的 软件 著作 权 归 属 问题 。 计 算 机 软件 著作 权 是 公民 、 法 人 和 其 他 
组 织 享有 的 一 项 重要 的 民事 权利 。 因 而 在 民事 权利 行使 、 流 转 的 过 程 中 ， 难 免 发 生 涉及 计算 机 
软件 著作 权 作为 标的 物 的 民事 、 经 济 关 系 ， 也 难免 发 生 争 议和 纠纷 。 争 议和 纠纷 发 生 后 由 人 民 
法 院 的 民事 判决 、 裁 定 而 产生 软件 著作 权 主 体 的 变更 ， 引 起 软件 著作 权 归 属 问题 。 因 司法 裁判 
引起 软件 著作 权 的 归属 问题 主要 有 4 类 : 一 类 是 由 人 民法 院 对 著作 权 归 属 纠纷 中 权利 的 最 终归 
属 作出 司法 裁判 ， 从 而 变更 了 计算 机 软件 著作 权 原 有 归属 ; 第 二 类 是 计算 机 软件 的 著作 权 人 为 
民事 法 律 关系 中 的 债务 人 《债务 形成 的 原因 可 能 多 种 多 样 , 如 合同 关系 或 者 损害 赔偿 关系 等 ) ， 
人 民法 院 将 其 软件 著作 财产 权 判 归 债 权 人 享有 抵债 ; 第 三 类 是 人 民法 院 作 出 民事 判决 判 令 软件 
著作 权 人 履行 民事 给 付 义务 ， 在 判决 生效 后 执行 程序 中 ， 其 无 其 他 财产 可 供 执行 ， 将 软件 著作 
财产 权 执 行 给 对 方 折 抵债 务 ;第 四 类 是 根据 破产 法 的 规定 ， 软 件 著作 权 人 被 破产 还 债 ， 软 件 著 
作 财产 权 作 为 法 律 规定 的 破产 财产 构成 的 “其 他 财产 权利 ”， 作 为 破产 财产 由 人 民法 院 判决 
分 配 。 

(5) 保护 期 限 届满 权利 丧失 。 软 件 著作 权 的 法 定 保护 期 限 可 以 确定 计算 机 软件 的 主体 能 和 否 
依法 变更 。 如 果 软 件 著作 权 已 过 保护 期 ， 该 软件 进入 公有 领域 ， 便 天 失 了 专 有 权 ， 也 就 没有 必 
要 改变 权利 主体 了 。 根 据 软 件 保护 条 例 的 规定 ， 计 算 机 软件 著作 权 主 体 变更 必须 在 该 软件 著作 
权 的 保护 期 限 内 进行 ， 转 让 活动 的 发 生 不 改变 该 软件 著作 权 的 保护 期 。 这 也 就 是 说 ， 转 让 活动 
也 不 能 延长 该 软件 著作 权 的 保护 期 限 。 


7. 计算 机 软件 著作 权 侵 权 的 鉴别 


侵犯 计算 机 软件 著作 权 的 违法 行为 的 鉴别 ， 主 要 依靠 保护 知识 产权 的 相关 法 律 来 判断 。 违 
反 著 作 权 、 计 算 机 软件 保护 条 例 等 法 律 禁止 的 行为 ， 便 是 侵犯 计算 机 著作 权 的 违法 行为 ， 这 是 
鉴别 违法 行为 的 本 质 原则 。 对 于 法 律 规定 不 禁止 ， 也 不 违反 相关 法 律 基本 原则 的 行为 ， 不 认为 
是 违法 行为 。 在 法 律 无 明文 具体 条 款 规定 的 情况 下 ， 违 背 著 作 权 法 和 计算 机 软件 保护 条 例 等 法 
律 的 基本 原则 ， 以 及 社会 主义 公共 生活 准则 和 社会 善良 风俗 的 行为 ， 也 应 该 视 为 违法 行为 。 在 
一 般 情 况 下 ， 损 害 他 人 著作 财产 权 或 人 身 权 的 行为 ， 都 是 违法 行为 。 
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1) 计算 机 软件 著作 权 侵权 行为 

根据 《计算 机 软件 保护 条 例 》 第 二 十 三 条 的 规定 ， 凡 是 行为 人 主观 上 具有 故意 或 者 过 失 对 
著作 权 法 和 计算 机 软件 保护 条 例 保护 的 计算 机 软件 人 身 权 和 财产 权 实施 侵害 行为 的 ， 都 构成 计 
算 机 软件 的 侵权 行为 。 该 条 规定 的 侵犯 计算 机 软件 著作 权 的 情况 ， 是 认定 软件 著作 权 侵 权 行 为 
的 法 律 依据 。 计 算 机 软件 侵权 行为 主要 有 以 下 几 种 。 

(1) 未 经 软件 著作 权 人 的 同意 而 发 表 或 者 登记 其 软件 作品 。 软 件 著作 人 享有 对 软件 作品 公 

开发 表 权 ， 未 经 允许 著作 权 人 以 外 的 任何 其 他 人 都 无 权 擅自 发 表 特定 的 软件 作品 。 如 果实 施 这 
种 行为 ， 就 构成 侵犯 著作 权 人 的 发 表 权 。 
(2) 将 他 人 开发 的 软件 当 作 自 己 的 作品 发 表 或 者 登记 。 此 种 行为 主要 侵犯 了 软件 著作 权 的 
开发 者 身份 权 和 署名 权 。 侵 权 行 为 人 其 世 盗 名 ， 惠 窃 软 件 开发 者 的 劳动 成 果 ， 将 他 人 开发 的 软 
件 作 品 假冒 为 自己 的 作品 而 署名 发 表 。 只 要 行为 人 实施 了 这 种 行为 ， 不 管 其 发 表 该 作品 是 否 经 
过 软件 著作 人 的 同意 ， 都 构成 侵权 。 

(3) 未 经 合作 者 的 同意 将 与 他 人 合作 开发 的 软件 当 作 自 己 独立 完成 的 作品 发 表 或 者 登记 。 此 
种 侵权 行为 发 生 在 软件 作品 的 合作 开发 者 之 间 。 作 为 合作 开发 的 软件 ， 软 件 作品 的 开发 者 身份 
为 全 体 开 发 者 ， 软 件 作品 的 发 表 权 也 应 由 全 体 开 发 者 共同 行使 。 如 果 未 经 其 他 开发 者 同意 ， 又 
将 合作 开发 的 软件 当 作 自 己 的 独创 作品 发 表 ， 即 构成 本 条 规定 的 侵权 行为 。 

(4) 在 他 人 开发 的 软件 上 署名 或 者 更 改 他 人 开发 的 软件 上 的 署名 。 这 种 行为 是 指 在 他 人 开 
发 的 软件 作品 上 添加 自己 的 署名 ， 或 者 替代 软件 开发 者 署名 ， 以 及 将 软件 作品 上 开发 者 的 署名 
进行 更 改 的 行为 。 这 种 行为 侵犯 了 软件 著作 人 的 开发 者 身份 权 及 署名 权 。 此 种 行为 与 第 〈2) 
条 规定 行为 的 区 别 主要 是 对 已 发 表 的 软件 作品 实施 的 行为 。 

(5) 未 经 软件 著作 权 人 或 者 其 合法 受 让 者 的 许可 ， 修 改 、 翻 译 其 软件 作品 。 此 种 行为 是 侵 
犯 了 著作 权 人 或 其 合法 受 让 者 的 使 用 权 中 的 修改 权 、 翻 译 权 。 对 不 同 版 本 计算 机 软件 ， 新 版 本 
往往 是 旧版 本 的 提高 和 改善 。 这 种 提高 和 改善 实质 上 是 对 原 软件 作品 的 修改 、 演 绎 。 此 种 行为 
应 征 得 软件 作品 原版 本 著作 权 人 的 同意 ， 否 则 构成 侵权 。 如 果 征 得 软件 作品 著作 人 的 同意 ， 修 
改 和 改善 新 增加 的 部 分 ， 创 作者 应 享有 著作 权 。 

(6) 未 经 软件 著作 权 人 或 其 合法 受 让 者 的 许可 ， 复 制 或 部 分 复制 其 软件 作品 。 此 种 行为 侵 
犯 了 著作 权 人 或 其 合法 受 让 者 的 使 用 权 中 的 复制 权 。 计算 机 软件 的 复制 权 是 计算 机 软件 最 重要 
的 著作 财产 权 ， 也 是 通常 计算 机 软件 侵权 行为 的 对 象 。 这 是 由 于 软件 载体 价格 相对 低廉 ， 复 制 
软件 简单 易 行 ， 效 率 极 高 ， 而 销售 非法 复制 的 软件 即 可 获得 高 额 利润 。 因 此 ， 复 制 是 常见 的 侵 
权 行为 ， 是 防止 和 打击 的 主要 对 象 。 当 软件 著作 权 经 当事人 的 约定 合法 转让 给 转让 者 以 后 ， 软 
件 开 发 者 未 经 允许 不 得 复制 该 软件 ， 和 否则 也 构成 本 条 规定 的 侵权 行为 。 

(7) 未 经 软件 著作 权 人 及 其 合法 受 让 者 同意 ， 向 公众 发 行 、 出 租 其 软件 的 复制 品 。 此 种 行 
为 侵犯 了 著作 权 人 或 其 合法 受 让 者 的 发 行 权 与 出 租 权 。 
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(8) 未 经 软件 著作 权 人 或 其 合法 受 让 者 同意 , 向 任何 第 三 方 办 理 软件 权利 许可 或 转让 事宜 ， 
这 种 行为 侵犯 了 软件 著作 权 人 或 其 合法 受 让 者 的 使 用 许可 权 和 转让 权 。 

(9) 未 经 软件 著作 权 人 及 其 合法 受 让 者 同意 ， 通 过 信息 网 络 传播 著作 权 人 的 软件 。 这 种 行 
为 侵犯 了 软件 著作 权 人 或 其 合法 受 让 者 的 信息 网 络 传播 权 。 

(10) 侵犯 计算 机 软件 著作 权 存在 着 共同 侵权 行为 。 两 人 以 上 共同 实施 《计算 机 软件 保护 
条 例 》 第 二 十 三 条 和 第 二 十 四 条 规定 的 侵权 行为 , 构成 共同 侵权 行为 。 对 行为 人 并 没有 实施 《 计 
算 机 软件 保护 条 例 》 第 二 十 三 条 和 第 二 十 四 条 规定 的 行为 ， 但 实施 了 向 侵权 行为 人 进行 侵权 活 
动 提供 设备 、 场 所 或 解密 软件 ， 或 者 为 侵权 复制 品 提供 仓储 、 运 输 条 件 等 行为 ， 构 成 共同 侵权 
应 当 在 行为 人 之 间 具 有 共同 故意 或 过 失 行为 。 其 构成 的 要 件 有 两 个 ， 一 是 行为 人 的 过 错 是 共同 
的 ， 而 不 论 行为 人 的 行为 在 整个 侵权 行为 过 程 中 所 起 的 作用 如 何 ; 二 是 行为 人 主观 上 要 有 故意 
或 过 失 的 过 错 。 如 果 这 两 个 要 件 具备 ， 各 个 行为 人 实施 的 侵权 行为 虽然 各 不 相同 ， 也 同样 构成 
共同 侵权 。 两 个 要 件 如 果 缺 乏 一 个 ， 不 构成 共同 的 侵权 ， 或 者 是 不 构成 任何 侵权 。 

2) 不 构成 计算 机 软件 侵权 的 合理 使 用 行为 

我 国 《计算 机 软件 保护 条 例 》 第 八条 第 四 项 和 第 十 六 条 规定 , 获得 使 用 权 或 使 用 许可 权 ( 视 
合同 条 款 ) 后 ， 可 以 对 软件 进行 复制 而 无 须 通 知 著作 权 人 ， 也 不 构成 侵权 。 对 于 合法 持 有 软件 
复制 品 的 单位 、 公 民 在 不 经 著作 权 人 同意 的 情况 下 ， 也 享有 复制 与 修改 权 。 合 法 持 有 软件 复制 
品 的 单位 、 公 民 ， 在 不 经 软件 著作 权 人 同意 的 情况 下 ， 可 以 根据 自己 使 用 的 需要 将 软件 装 入 计 
算 机 ， 为 了 存档 也 可 以 制作 复制 品 ， 为 了 把 软件 用 于 实际 的 计算 机 环境 或 者 改进 其 功能 时 也 可 
以 进行 必要 的 修改 ， 但 是 复制 品 和 修改 后 的 文本 不 能 以 任何 方式 提供 给 他 人 。 超 过 以 上 权利 ， 
即 视 为 侵权 行为 。 区 分 合理 使 用 与 非 合理 使 用 的 判别 标准 一 般 有 以 下 几 个 。 

(1) 软件 作品 是 否 合法 取得 。 这 是 合理 使 用 的 基础 。 

(2) 使 用 目的 是 非 商业 营业 性 。 如 果 使 用 的 目的 是 为 商业 性 营利 ， 就 不 属 合理 使 用 的 范围 。 

(3) 合理 使 用 一 般 为 少量 的 使 用 。 所 谓 少量 的 界限 ， 根 据 其 使 用 的 目的 以 行业 惯例 和 和 人们 
一 般 常 识 所 综合 确定 。 超 过 通常 被 认为 的 少量 界限 ， 即 可 被 认为 不 属 合理 使 用 。 

我 国 《计算 机 软件 保护 条 例 》 第 十 七 条 规定 : “为 了 学 习 和 研究 软件 内 含 的 设计 思想 和 原 
理 ， 通 过 安装 、 显 示 、 传 输 或 者 存储 软件 的 方式 使 用 软件 的 ， 可 以 不 经 软件 著作 权 人 许可 ， 不 
向 其 支付 报酬 。” 

3) 计算 机 著作 权 软 件 侵权 的 识别 

计算 机 软件 明显 区 别 于 其 他 著作 权 法 保护 的 客体 ， 它 具有 以 下 特点 。 

(1) 技术 性 。 计 算 机 软件 的 技术 性 是 指 其 创作 开发 的 高 技术 性 。 具 有 一 定 规模 的 软件 的 创 
作 开 发 ， 一 般 开 发 难度 大 、 周 期 长 、 投 资 高 ， 需 要 良好 组 织 ， 严 密 管理 且 各 方面 人 员 配 合 协作 ， 
借助 现代 化 高 技术 和 高 科技 工具 生产 创作 。 

(2) 依赖 性 。 计 算 机 程序 的 依赖 性 是 指 人 们 对 其 的 感知 依赖 于 计算 机 的 特性 。 著 作 权 保护 
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的 其 他 作品 一 般 都 可 以 依赖 人 的 感觉 器 官 所 直接 感知 。 但 计算 机 程序 则 不 能 被 人 们 所 直接 感 
知 ， 它 的 内 容 只 能 依赖 计算 机 等 专用 设备 才能 被 充分 表现 出 来 ， 才 能 被 人 们 所 感知 。 

(3) 多 样 性 。 计 算 机 程序 的 多 样 性 是 指 计算 机 程序 表达 的 多 样 性 。 计 算 机 程序 的 表达 比 著 
作 权 法 保护 的 其 他 对 象 特殊 ， 其 既 能 以 源 代码 表达 ， 还 可 以 以 目标 代码 和 伪 码 等 表达 ， 表 达 形 
式 多样 。 计 算 机 程序 表达 的 存储 媒体 也 多 种 多 样 ， 同 一 种 程序 分 别 可 以 被 存储 在 纸张 、 磁 盘 、 
磁带 、 光 盘 和 集成 电路 上 等 。 计 算 机 程序 的 载体 大 多 数 精巧 灵 便 。 此 外 ， 计 算 机 程序 的 内 容 与 
表达 难以 严格 区 别 界定 。 

(4) 运行 性 。 计 算 机 程序 的 运行 性 是 指 计算 机 程序 功能 的 运行 性 。 计 算 机 程序 不 同 于 一 般 
的 文字 作品 ， 它 主要 的 功能 在 于 使 用 。 也 就 是 说 ， 计 算 机 程序 的 功能 只 能 通过 对 程序 的 使 用 、 
运行 才能 充分 体现 出 来 。 计 算 机 程序 采用 数字 化 形式 存储 、 转 换 ， 复 制品 与 原作 品 一 般 无 明显 
区 别 。 

根据 计算 机 软件 的 特点 ， 对 计算 机 软件 侵权 行为 的 识别 可 以 通过 将 发 生 争议 的 某 一 计算 机 
程序 与 比照 物 (权利 明确 的 正版 计算 机 程序 ) 进行 对 比 和 鉴别 ， 从 两 个 软件 的 相似 性 或 是 否 完 
全 相同 来 判断 ， 做 出 侵权 认定 。 软 件 作品 常常 表现 为 计算 机 程序 的 不 唯一 性 ， 两 个 运行 结果 相 
同 的 计算 机 程序 ， 或 者 两 个 计算 机 软件 的 源 代码 程序 不 相似 或 不 完全 相似 ， 前 者 不 一 定 构成 侵 
权 ， 而 后 者 不 一 定 不 构成 侵权 。 


8. 软件 著作 权 侵权 的 法 律 责任 


当 侵 权 人 侵害 他 人 的 著作 权 、 财 产权 或 著作 人 身 权 , 造成 权利 人 财产 上 的 或 非 财产 的 损失 ， 
侵权 人 不 履行 赔偿 义务 ， 法 律 即 强制 侵权 人 承担 赔偿 损失 的 民事 责任 。 

1) 民事 责任 

侵犯 计算 机 著作 权 以 及 有 关 权益 的 民事 责任 是 指 公民 、 法 人 或 其 他 组 织 因 侵犯 著作 权 发 生 
的 后 果 依 法 应 承担 的 法 律 责任 。 我 国 《计算 机 软件 保护 条 例 》 第 二 十 三 条 规定 了 侵犯 计算 机 著 
作 权 的 民事 责任 ， 即 侵犯 著作 权 或 者 与 著作 权 有 关 的 权利 的 ， 侵 权 人 应 当 按照 权利 人 的 实际 损 
失 给 予 赔 偿 ; 实际 损失 难以 计算 的 ， 可 以 按照 侵权 人 的 违法 所 得 给 予 赔偿 。 财 偿 数额 还 应 当 包 
括 权 利 人 为 制止 侵权 行为 所 支付 的 合理 开支 。 权 利 人 的 实际 损失 或 者 侵权 人 的 违法 所 得 不 能 确 
定 的 ， 由 人 民法 院 根据 侵权 行为 的 情节 ， 判 决 给 予 五 十 万 元 以 下 的 赔偿 。 有 下 列 侵权 行为 的 ， 
应 当 根 据 情况 承担 停止 侵害 、 消 除 影响 、 公 开 赔 礼 道歉 或 赔偿 损失 等 民事 责任 。 

(1) 未 经 软件 著作 权 人 许可 发 表 或 者 登记 其 软件 的 。 

(2) 将 他 人 软件 当 作 自 己 的 软件 发 表 或 者 登记 的 。 

(3) 未 经 合作 者 许可 , 将 与 他 人 合作 开发 的 软件 当 作 自 己 单独 完成 的 作品 发 表 或 者 登记 的 。 

(4) 在 他 人 软件 上 署名 或 者 涂改 他 人 软件 上 的 署名 的 。 
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(5) 未 经 软件 著作 权 人 人 许可， 修改、 翻译 其 软件 的 。 

(6) 其 他 侵犯 软件 著作 权 的 行为 。 

2) 行政 责任 

我 国 《 计 算 机 软件 保护 条 例 》 第 二 十 四 条 规定 了 相应 的 行政 责任 ， 即 对 侵犯 软件 著作 权 行 
为 ， 著 作 权 行政 管理 部 门 应 当 责 令 停止 违法 行为 ， 没 收 非法 所 得 ， 没 收 、 销 毁 侵 权 复制 品 ， 并 
可 处 以 每 件 一 百 元 或 者 货 值 金额 二 至 五 倍 的 罚款 。 有 下 列 侵权 行为 的 ， 应 当 根 据 情况 承担 停止 
侵害 、 消 除 影响 、 公 开 赔 礼 道歉 或 赔偿 损失 等 行政 责任 。 

(1) 复制 或 者 部 分 复制 著作 权 人 软件 的 。 

(2) 向 公众 发 行 、 出 租 、 通 过 信息 网 络 传播 著作 权 人 软件 的 。 

(3) 故意 避 开 或 者 破坏 著作 权 人 为 保护 其 软件 而 采取 的 技术 措施 的 。 

(4) 故意 删除 或 者 改变 软件 权利 管理 电子 信息 的 。 

(5) 许可 他 人 行使 或 者 转让 著作 权 人 的 软件 著作 权 的 。 

3) 刑事 责任 

侵权 行为 触犯 刑律 的 ， 侵 权 者 应 当 承担 刑事 责任 。 我 国 《刑法 》 第 二 百 一 十 七 条 、 第 二 百 
一 十 八条 和 第 二 百 二 十 条 规定 ， 构 成 侵犯 著作 权 罪 、 销 售 侵权 复制 品 罪 的 ， 由 司法 机 关 追 究 刑 
事 责 任 。 


11.2.3 ”计算 机 软件 的 商业 秘密 权 


关于 商业 秘密 的 法 律 保护 ， 各 国 采 取 不 同 的 法 律 ， 有 的 制定 单行 法 ， 有 的 规定 在 反 不 正当 
竞争 法 中 ， 有 的 适用 一 般 侵权 行为 法 。 我 国 反 不 正当 竞争 法 规定 了 商业 秘密 的 保护 问题 。 


1. 商业 秘密 


1) 商业 秘密 的 定义 

《 反 不 正当 竞争 》 中 商业 秘密 定义 为 “ 指 不 为 公众 所 知悉 的 、 能 为 权利 人 带 来 经 济 利益 、 
具有 实用 性 并 经 权利 人 采取 保密 措施 的 技术 信息 和 经 营 信息 ”。 经营 秘密 和 技术 秘密 是 商业 秘 
密 的 基本 内 容 。 经 营 秘密 ， 即 未 公开 的 经 营 信 息 ， 是 指 与 生产 经 营销 售 活动 有 关 的 经 营 方法 、 
管理 方法 、 产 销 策略 、 货 源 情报 、 客 户 名 单 、 标 底 和 标书 内 容 等 专 有 知识 。 技 术 秘 密 ， 即 未 公 
的 技术 信息 ， 是 指 与 产品 生产 和 制造 有 关 的 技术 诀窍、 生产 方案 、 工 艺 流程 、 设 计 图 纸 、 化 
学 配方 和 技术 情报 等 专 有 知识 。 

2) 商业 秘密 的 构成 条 件 

商业 秘密 的 构成 条 件 是 : 商业 秘密 必须 具有 未 公开 性 ， 即 不 为 公众 所 知悉 ， 商 业 秘 密 必须 
上 共有 实用 性 ， 即 能 为 权利 人 带 来 经 济 效益 ; 商业 秘密 必须 具有 保密 性 ， 即 采取 了 保密 措施 。 
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3) 商业 秘密 权 

商业 秘密 是 一 种 无 形 的 信息 财产 。 与 有 形 财产 相 区 别 ， 商 业 秘密 不 占据 空间 ,不 易 被 权利 
人 所 控制 ， 不 发 生 有 形 损耗 ， 其 权利 是 一 种 无 形 财产 权 。 商 业 秘密 的 权利 人 与 有 形 财产 所 有 权 
人 一 样 ， 依 法 享有 占有 、 使 用 和 收益 的 权利 ， 即 有 权 对 商业 秘密 进行 控制 与 管理 ， 防 止 他 人 采 
取 不 正当 手段 获取 与 使 用 ， 有 权 依 法 使 用 自己 的 商业 秘密 ， 而 不 受 他 人 干涉 ; 有 权 通过 自己 使 
用 或 者 许可 他 人 使 用 以 至 转让 所 有 权 ， 从 而 取得 相应 的 经 济 利益 ， 有 权 处 理 自 己 的 商业 秘密 ， 
包括 放弃 占有 、 无 偿 公 开 、 赠 与 或 转让 等 。 

4) 商业 秘密 的 丧失 

一 项 商业 秘密 受到 法 律 保护 的 依据 是 必须 具备 上 述 构成 商业 秘密 的 3 个 条 件 , 当 缺 少 上 述 
3 个 条 件 之 一 时 就 会 造成 商业 秘密 丧失 保护 。 


2. 计算 机 软件 与 商业 秘密 


《 反 不 正当 竞争 》 保 护 计算 机 软件 ， 是 以 计算 机 软件 中 是 否 包含 着 “商业 秘密 ”为 必要 条 
件 的 。 而 计算 机 软件 是 人 类 知识 、 智 慧 、 经 验 和 创造 性 劳动 的 成 果 ， 本 身 就 具有 商业 秘密 的 特 
征 ， 即 包含 着 技术 秘密 和 经 营 秘密 。 即 使 是 软件 尚未 开发 完成 ， 在 软件 开发 中 所 形成 的 知识 内 
容 也 可 构成 商业 秘密 。 

1) 计算 机 软件 商业 秘密 的 侵权 

侵犯 商业 秘密 ， 是 指 行为 人 ( 负 有 约定 的 保密 义务 的 合同 当事人 ; 实施 侵权 行为 的 第 三 人 ; 
侵犯 本 单位 商业 秘密 的 行为 人 ) 未 经 权利 人 (商业 秘密 的 合法 控制 人 ) 的 许可 ,以 非法 手段 ( 包 
括 直 接 从 权利 人 那里 窃取 商业 秘密 并 加 以 公开 或 使 用 ; 通过 第 三 人 窃取 权利 人 的 商业 秘密 并 加 
以 公开 或 使 用 ) 获取 计算 机 软件 商业 秘密 并 加 以 公开 或 使 用 的 行为 。 根 据 我 国 《 反 不 正当 竞争 
法 》 第 十 条 的 规定 ， 侵 犯 计算 机 软件 商业 秘密 的 具体 表现 形式 主要 如 下 。 

(1) 以 盗 穷 、 利 诱 、 胁 迫 或 其 他 不 正当 手段 获取 权利 人 的 计算 机 软件 商业 秘密 。 盗 窃 商 业 
秘密 ， 包 括 单位 内 部 人 员 盗 窃 、 外 部 人 员 盗 窃 、 内 外 勾结 盗窃 等 手段 ， 以 利诱 手段 获取 商业 秘 
密 ， 通 常 指 行为 人 向 掌握 商业 秘密 的 人 员 提 供 财物 或 其 他 优惠 条 件 ， 诱 使 其 向 行为 人 提供 商业 
秘密 ; 以 胁迫 手段 获取 商业 秘密 ， 是 指 行为 人 采取 威胁 、 强 迫 手 段 ， 使 他 人 在 受 强制 的 情况 下 
提供 商业 秘密 ;以 其 他 不 正当 手段 获取 商业 秘密 。 

(2) 披露 、 使 用 或 允许 他 人 使 用 以 不 正当 手段 获取 的 计算 机 软件 商业 秘密 。 披 露 是 指 将 权 
利 人 的 商业 秘密 向 第 三 人 透露 或 向 不 特定 的 其 他 人 公开 ， 使 其 失去 秘密 价值 ; 使 用 或 允许 他 人 
使 用 是 指 非法 使 用 他 人 商业 秘密 的 具体 情形 。 以 非法 手段 获取 商业 秘密 的 行为 人 ， 如 果 将 该 秘 
密 再 行 披露 或 使 用 ， 即 构成 双重 的 侵权 ; 倘若 第 三 人 从 侵权 人 那里 获悉 了 商业 秘密 而 将 秘密 披 
露 或 使 用 ， 同 样 构 成 侵权 。 

(3) 违反 约定 或 违反 权利 人 有 关 保 守 商 业 秘 密 的 要 求 ， 披 露 、 使 用 或 允许 他 人 使 用 其 所 掌 
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握 的 计算 机 软件 商业 秘密 。 合法 掌握 计算 机 软件 商业 秘密 的 人 ， 可 能 是 与 权利 人 有 合同 关系 的 
对 方 当事人 ， 也 可 能 是 权利 人 的 单位 工作 人 员 或 其 他 知情 人 ， 他 们 违反 合同 约定 或 单位 规定 的 
保密 义务 ， 将 其 所 掌握 的 商业 秘密 擅自 公开 ， 或 自己 使 用 ， 或 许可 他 人 使 用 ， 即 构成 侵犯 商业 
秘密 。 

(4) 第 三 人 在 明知 或 应 知 前 述 违法 行为 的 情况 下 ， 仍 然 从 侵权 人 那里 获取 、 使 用 或 披露 他 
人 的 计算 机 软件 商业 秘密 。 这 是 一 种 间接 的 侵权 行为 。 

2) 计算 机 软件 商业 秘密 侵权 的 法 律 责任 

根据 我 国 《 反 不 正当 竞争 法 》 和 《刑法 》 的 规定 ， 计 算 机 软件 商业 秘密 的 侵权 者 将 承担 行 
政 责任 、 民 事 责 任 以 及 刑事 责任 。 

(1) 侵权 者 的 行政 责任 。 我 国 《 反 不 正当 竞争 法 》 第 二 十 五 条 规定 了 相应 的 行政 责任 ， 即 
对 侵犯 商业 秘密 的 行为 ， 监督 检查 部 门 应 当 责 令 停止 违法 行为 ， 而 后 可 以 根据 侵权 的 情节 依法 
处 以 1 万 元 以 上 20 万 元 以 下 的 罚款 。 

(2) 侵权 者 的 民事 责任 。 计 算 机 软件 商业 秘密 的 侵权 者 的 侵权 行为 对 权利 人 的 经 营造 成 经 
济 上 的 损失 时 ， 侵 权 者 应 当 承 担 经 济 损害 赔偿 的 民事 责任 。 我 国 《 反 不 正当 竞争 法 》 第 二 十 条 
规定 了 侵犯 商业 秘密 的 民事 责任 ， 即 经 营 者 违反 该 法 规定 ， 给 被 侵害 的 经 营 者 造成 损害 的 ， 应 
当 承 担 损害 赔偿 责任 。 被 侵害 的 经 营 者 的 合法 权益 受到 损害 的 ， 可 以 向 人 民法 院 提起 诉讼 。 

(3) 侵权 者 的 刑事 责任 。 侵 权 者 以 盗 穷 、 利 诱 、 胁 迫 或 其 他 不 正当 手段 获取 权利 人 的 计算 
机 软件 商业 秘密 ; 披露 、 使 用 或 允许 他 人 使 用 以 不 正当 手段 获取 的 计算 机 软件 商业 秘密 ;违反 
约定 或 违反 权利 人 有 关 保 守 商 业 秘密 的 要 求 ， 披 露 、 使 用 或 允许 他 人 使 用 其 所 掌握 的 计算 机 软 
件 商业 秘密 ， 其 侵权 行为 对 权利 人 造成 重大 损害 的 ， 侵 权 者 应 当 承担 刑事 责任 。 我 国 《刑法 》 
第 二 百 一 十 九条 规定 了 侵犯 商业 秘密 罪 ， 即 实施 侵犯 商业 秘密 行为 ， 给 商业 秘密 的 权利 人 造成 
重大 损失 的 ， 处 3 年 以 下 有 期 徒刑 或 者 拘役 ， 并 处 或 者 单 处 罚金 ， 造 成 特别 严重 后 果 的 ， 处 
3 年 以 上 7 年 以 下 有 期 徒刑 ， 并 处 罚金 。 


11.2.4 ”专利 权 概述 


1. 专利 权 的 保护 对 象 与 特征 


发 明 创造 是 产生 专利 权 的 基础 。 发 明 创造 是 指 发 明 、 实 用 新 型 和 外 观 设计 ， 是 我 国 专利 法 
主要 保护 的 对 象 。 我国 《专利 法 实施 细则 》 第 二 条 第 一 款 规 定 : “专利 法 所 称 的 发 明 ， 是 指 对 
产品 、 方 法 或 者 其 改进 所 提出 的 技术 方案 ”。 实 用 新 型 (也 称 小 发 明 〉 则 因 国 而 异 ， 我国 《 专 
利 法 实施 细则 》 第 二 条 第 二 款 规 定 : “实用 新 型 是 指 对 产品 的 形状 、 构 造 或 者 其 组 合 所 提出 的 
新 的 技术 方案 ”。 外 观 设 计 是 指 对 产品 的 形状 、 图 案 、 色 彩 或 者 它们 的 结合 所 做 出 的 富有 美感 
的 并 适 于 工业 应 用 的 新 设计 。 
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专利 的 发 明 创造 是 无 形 的 智力 创造 性 成 果 ， 不 像 有 形 财产 那样 直观 可 见 ， 必 须 经 专利 主管 机 
关 依 照 法 定 程序 审查 确定 ， 在 未 经 审批 以 前 ， 任 何 一 项 发 明 创造 都 不 得 成 为 专利 。 

下 列 各 项 属于 专利 法 不 适用 的 对 象 ， 因 此 不 授予 专利 权 。 

(1) 违反 国家 法 律 、 社 会 公德 或 者 妨害 公共 利益 的 发 明 创造 。 

(2) 科学 发 现 ， 即 人 们 通过 自己 的 智力 劳动 对 客观 世界 已 经 存在 的 但 未 揭示 出 来 的 规律 、 
性 质 和 现象 等 的 认识 。 

(3) 智力 活动 的 规则 和 方法 ， 即 人 们 进行 推理 、 分 析 、 判 断 、 运 算 、 处 理 、 记 忆 等 思维 活 
动 的 规则 和 方法 。 

(4) 病 的 诊断 和 治疗 方法 。 即 以 活 的 人 或 者 动物 为 实施 对 象 ， 并 以 防 病 治 病 为 目的 ， 是 医 
护 人 员 的 经 验 体现 ， 而 且 因 被 诊断 和 治疗 的 对 象 不 同 而 有 区 别 ， 不 能 在 工业 上 应 用 ， 不 具有 实 
用 性 。 

(5) 动物 和 植物 品种 ， 但 是 动物 植物 品种 的 生产 方法 ， 可 以 依照 专利 法 规定 授予 专利 权 。 

(6) 用 原子 核 变 换 方法 获得 的 物质 ， 即 用 核 裂变 或 核 聚 变 方法 获得 的 单质 或 化 合 物 。 


2. 授予 专利 权 的 条 件 


授予 专利 权 的 条 件 是 指 一 项 发 明 创 造 获得 专利 权 应 当 具 备 的 实质 性 条 件 。 一 项 发 明 或 者 实 
用 新 型 获得 专利 权 的 实质 条 件 为 新 颖 性 、 创 造 性 和 实用 性 。 

(1) 新 颖 性 。 新 颖 性 是 指 在 申请 日 以 前 没有 同样 的 发 明 或 实用 新 型 在 国内 外 出 版 物 公 开发 
表 过 , 在 国内 公开 使 用 过 或 以 其 他 方式 为 公众 所 知 ， 也 没有 同样 的 发 明 或 实用 新 型 由 他 人 向 专 
利 局 提出 过 申请 并 且 记 载 在 申请 日 以 后 公布 的 专利 申请 文件 中 。 在 某 些 特殊 情况 下 ， 尽 管 申 请 
专利 的 发 明 或 者 实用 新 型 在 申请 日 或 者 优先 权 日 前 公开 ， 但 在 一 定 的 期 限 内 提出 专利 申请 的 
仍然 具有 新 颖 性 。 我 国 专利 法 规定 ， 申 请 专利 的 发 明 创造 在 申请 日 以 前 6 个 月 内 ， 有 下 列 情况 
之 一 的 ， 不 丧失 新 颖 性 。 

@ 在 中 国政 府 主办 或 者 承认 的 国际 展览 会 上 首次 展 出 的 。 

@) 在 规定 的 学 术 会 议 或 者 技术 会 议 上 首次 发 表 的 。 

@ 他 人 未 经 申请 人 同意 而 泄露 其 内 容 的 。 

(2) 创造 性 。 创 造 性 是 指 同 申请 日 以 前 已 有 的 技术 相 比 ， 该 发 明 有 突出 的 实质 性 特点 和 显 
著 的 进步 ， 该 实用 新 型 有 实质 性 特点 和 进步 。 例 如 ， 申 请 专利 的 发 明 解决 了 人 们 渴望 解决 但 一 
直 没 有 解决 的 技术 难题 ， 申 请 专利 的 发 明 克 服 了 技术 偏见 ， 申 请 专利 的 发 明 取 得 了 意 想不到 的 
技术 效果 ; 申请 专利 的 发 明 在 商业 上 获得 成 功 。 一 项 发 明 专 利 是 否 具有 创造 性 ， 前 提 是 该 项 发 
明 具 备 新 颖 性 。 

(3) 实用 性 。 实 用 性 是 指 该 发 明 或 者 实用 新 型 能 够 制造 或 者 使 用 ， 并 且 能 够 产生 积极 的 效 
果 ， 即 不 造成 环境 污染 、 能 源 或 者 资源 的 严重 浪费 ， 损 害 人 体 健康 。 如 果 申 请 专利 的 发 明 或 者 
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实用 新 型 缺乏 技术 手段 ， 申 请 专利 的 技术 方案 违背 自然 规律 ; 利用 独一无二 自然 条 件 所 完成 的 
技术 方案 ， 则 不 具有 实用 性 。 

我 国 专利 法 规定 ， 外 观 设计 获得 专利 权 的 实质 条 件 为 新 颖 性 和 美观 性 。 新颖 性 是 指 申请 专 
利 的 外 观 设 计 与 其 申请 日 以 前 已 经 在 国内 外 出 版 物 上 公开 发 表 的 外 观 设 计 不 相同 或 者 不 相近 
似 ; 与 其 申请 日 前 已 在 国内 公开 使 用 过 的 外 观 设计 不 相同 或 者 不 相近 似 。 美观 性 是 指 外 观 设计 
被 使 用 在 产品 上 时 能 使 人 产生 一 种 美感 ， 增 加 产品 对 消费 者 的 吸引 力 。 


3. 专利 的 申请 


1) 专利 申请 权 

公民 、 法 人 或 者 其 他 组 织 依据 法 律 规定 或 者 合同 约定 享有 的 就 发 明 创造 向 专利 局 提出 专利 
申请 的 权利 〈 专 利 申请 权 ) 。 一 项 发 明 创造 产 生 的 专利 申请 权 归 谁 所 有 ， 主 要 有 由 法 律 直接 规 
定 的 情况 和 依 合同 约定 的 情况 。 专 利 申请 权 可 以 转让 ， 不 论 专利 申请 权 在 哪 一 个 时 间 段 转让 
原 专 利 申 请 人 便 因 此 形 失 专利 申请 权 ， 由 受 让 人 获得 相应 的 专利 申请 权 。 专 利 申 请 权 可 以 被 继 
承 或 赠与 。 专 利 申请 人 死亡 后 , 其 依法 享有 的 专利 申请 权 可 以 作为 遗产 , 由 其 合法 继承 人 继承 。 

2) 专利 申请 人 

专利 申请 人 是 指 对 某 项 发 明 创造 依法 律 规定 或 者 合同 约定 享有 专利 申请 权 的 公民 、 法 人 或 
者 其 他 组 织 。 专 利 申请 人 包括 职务 发 明 创造 的 单位 ， 非 职务 发 明 创造 的 专利 申请 人 为 完成 发 明 
创造 的 发 明和 人 或 者 设计 人 ; 共同 发 明 创造 的 专利 申请 人 是 共同 发 明 人 或 者 设计 人 , 或 者 其 所 属 
单位 ， 委 托 发 明 创造 的 专利 申请 人 为 合同 约定 的 人 ; 受 让 人 。 

3) 专利 申请 的 原则 

专利 申请 人 及 其 代理 人 在 办 理 各 种 手续 时 都 应 当 采 用 书面 形式 。 一 份 专利 申请 文件 只 能 就 
一 项 发 明 创造 提出 专利 申请 ， 即 “一 份 申请 一 项 发 明 ” 原 则 。 两 个 或 者 两 个 以 上 的 人 分 别 就 同 
样 的 发 明 创造 申请 专利 的 ， 专 利 权 授 给 最 先 申请 人 。 

4) 专利 申请 文件 

发 明 或 者 实用 新 型 申请 文件 包括 请 求 书 、 说 明 书 、 说 明 书 摘要 和 权利 要 求 书 。 外 观 设计 专 
利 申请 文件 包括 请 求 书 、 图 片 或 照片 。 

5) 专利 申请 日 

专利 申请 日 (也 称 关键 日 ) 是 专利 局 或 者 专利 局 指定 的 专利 申请 受理 代办 处 收 到 完整 专利 
申请 文件 的 日 期 。 如 果 申 请 文件 是 邮寄 的 ， 以 寄 出 的 邮戳 日 为 申请 日 。 

6) 专利 申请 的 审批 

专利 局 收 到 发 明 专 利 申请 后 , 一 个 必要 程序 是 初步 审查 , 经 初步 审查 认为 符合 本 法 要 求 的 ， 
自 申 请 日 起 满 18 个 月 ， 即 行 公布 〈 公 布 申 请 )， 专 利 局 可 根据 申请 人 的 请 求 ， 早 日 公布 其 申请 。 
自 申 请 日 起 三 年 内 ， 专 利 局 可 以 根据 申请 人 随时 提出 的 请 求 ， 对 其 申请 进行 实质 审查 。 实 质 审 
查 是 专利 局 对 申请 专利 的 发 明 的 新 颖 性 、 创 造 性 和 实用 性 等 依法 进行 审查 的 法 定 程序 。 


or 
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我 国 专利 法 规定 :“ 实 用 新 型 和 外 观 设计 专利 申请 经 初步 审查 没有 发 现 驱 回 理由 的 ， 专 利 
局 应 当做 出 授予 实用 新 型 专利 权 或 者 外 观 设计 专利 权 的 决定 ， 发 给 相应 的 专利 证 书 ， 并 予以 登 
记 和 公布 >。 由 此 规定 可 知 ， 对 实用 新 型 和 外 观 设 计 专利 申请 只 进行 初步 审查 ， 不 进行 实质 
审查 。 

7) 申请 权 的 丧失 与 恢复 

专利 法 及 其 实施 细则 有 许多 条 款 规 定 ， 如 果 申 请 人 在 法 定期 间或 者 专利 局 所 指定 的 期 限 内 
未 办 理 相应 的 手续 或 者 没有 提交 有 关 文件 ， 其 申请 就 被 视 为 撤回 或 者 丧失 提出 某 项 请 求 的 权 
利 ,或 者 导致 有 关 权 利 终止 后 果 。 因 耽误 期 限 而 丧失 权利 之 后 , 可 以 在 自 障碍 消除 后 两 个 月 内 
最 迟 自 法 定期 限 或 者 指定 期 限 届满 后 两 年 内 或 者 自 收 到 专利 局 通知 之 日 起 两 个 月 内 ， 请 求 恢复 
其 权利 。 


4. 专利 权 行 使 


1) 专利 权 的 归属 

根据 《中 华人 民 共 和 国 专利 法 》 的 规定 ， 执 行 本 单位 的 任务 或 者 主要 是 利用 本 单位 的 物质 
条 件 所 完成 的 职务 发 明 创造 ， 申 请 专利 的 权利 属于 该 单位 。 申 请 被 批准 后 ， 专 利 权 归 该 单位 持 
有 单位 为 专利 权 人 )。 执 行 本 单位 的 任务 所 完成 的 职务 发 明 创 造 是 指 : 

(1) 在 本 职工 作 中 做 出 的 发 明 创 造 。 

(2) 履行 本 单位 交付 的 本 职工 作 之 外 的 任务 所 做 出 的 发 明 创造 。 

(3) 工作 变动 (退职 、 退 休 或 者 调 离 ) 后 短期 内 做 出 的 ， 与 其 在 原单 位 承担 的 本 职工 作 或 
者 原单 位 分 配 的 任务 有 关 的 发 明 创造 。 

本 单位 的 物质 技术 条 件 包括 本 单位 的 资金 、 设 备 、 零 部 件 、 原 材料 或 者 不 对 外 公开 的 技术 
资料 等 。 

非 职务 发 明 创造 ， 申 请 专利 的 权利 属于 发 明 人 或 者 设计 人 ; 在 中 国境 内 的 外 资 企 业 和 中 外 
合资 经 营 企业 的 工作 人 员 完 成 的 职务 发 明 创 造 ， 申 请 专利 的 权利 属于 该 企业 ， 申 请 被 批准 后 ， 
专利 权 归 申请 的 企业 或 者 个 人 所 有 ; 两 个 以 上 单位 协作 或 者 一 个 单位 接受 其 他 单位 委托 的 研 
究 、 设 计 任 务 所 完成 的 发 明 创造 ， 除 另 有 协议 的 以 外 ， 申 请 专利 的 权利 属于 完成 或 者 共同 完成 
的 单位 ， 申 请 被 批准 后 ， 专 利 权 归 申 请 的 单位 所 有 或 者 持 有 。 

2) 专利 权 人 的 权利 

专利 权 是 一 种 具有 财产 权 属性 的 独占 权 以 及 由 其 衍生 出 来 和 相应 处 理 权 。 专 利 权 人 的 权利 
包括 独占 实施 权 、 转 让 权 、 实 施 许可 权 、 放 弃权 和 标记 权 等 。 专 利 权 人 有 缴纳 专利 年 费 〈 也 称 
专利 维持 费 ) 和 实际 实施 已 获 专利 的 发 明 创 造 两 项 基本 义务 。 

专利 权 人 通过 专利 实施 许可 合同 将 其 依法 取得 的 对 某 项 发 明 创造 的 实施 权 转 移 给 非 专利 
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权 信 行使。 任何 单 位 或 者 个 人 实施 他 人 专利 的 ， 除 《中 华人 民 共 和 国 专利 法 》 第 十 四 条 规定 的 
以 外 ， 都 必须 与 专利 权 人 订立 书面 实施 许可 合同 ， 向 专利 权 人 支付 专利 使 用 费 。 被 许可 人 无 权 
人 允许 合同 规定 以 外 的 任何 单位 或 者 个 人 实施 该 专利 。 专 利 实施 许可 的 种 类 包括 独占 许可 、 独 家 
许可 、 普 通 许可 和 部 分 许可 。 


5. 专利 权 的 限制 


根据 《中 华人 民 共 和 国 专利 法 》 的 规定 ， 发 明 专利 权 的 保护 期 限 为 自 申 请 日 起 20 年 ， 实 
用 新 型 专利 权 和 外 观 设计 专利 权 的 保护 期 限 为 自 申请 日 起 10 年 。 发 明 创造 专利 权 的 法 律 效力 
所 及 的 范围 如 下 。 

(1) 发 明 或 者 实用 新 型 专利 权 的 保护 范围 以 其 权利 要 求 的 内 容 为 准 ， 说 明 书 及 附 图 可 以 用 
于 解释 权利 要 求 。 

(2) 外 观 设计 专利 权 的 保护 范围 以 表示 在 图 片 或 者 照片 中 的 该 外 观 设计 专利 产品 为 准 。 

公告 授予 专利 权 后 ， 任 何 单位 或 个 人 认为 该 专利 权 的 授予 不 符合 专利 法 规定 条 件 的 ， 可 以 
向 专利 复查 委员 会 提出 宣告 该 专利 权 无 效 的 请 求 。 专 利 复审 委员 会 对 这 种 请 求 进行 审查 ， 做 出 
宣告 专利 权 无 效 或 维持 专利 权 的 决定 。 我 国 专利 法 规定 ， 提 出 无 效 宣告 请 求 的 时 间 (启动 无 效 
宣告 程序 的 时 间 ) 始 于 “ 自 专利 局 公告 授予 专利 权 之 日 起 ”。 

专利 权 因 某 种 法 律 事实 的 发 生 而 导致 其 效力 消灭 的 情形 称 为 专利 权 终 止 。 导 致 专利 权 终 止 
的 法 律 事 实 如 下 。 

(1) 保护 期 限 届满 。 

(2) 在 专利 权 保护 期 限 届满 前 ， 专 利 权 人 以 书面 形式 向 专利 局 声明 放弃 专利 权 。 

(3) 在 专利 权 的 保护 期 限 内 ， 专 利 权 人 没有 按照 法 律 的 规定 交 年 费 。 专 利 权 终止 日 应 为 上 
一 年 度 期 满 日 。 

专利 法 允许 第 三 人 在 某 些 特殊 情况 下 ， 可 以 不 经 专利 权 人 许可 而 实施 其 专利 ， 且 其 实施 行 
为 并 不 构成 侵权 的 一 种 法 律 制度 。 专 利 权限 制 的 种 类 包括 强制 许可 、 不 视 为 侵犯 专利 权 的 行为 
和 国家 计划 许可 。 


6. 专利 侵权 行为 


专利 侵权 行为 是 指 在 专利 权 的 有 效 期 限 内 ， 任 何 单位 或 者 个 人 在 未 经 专利 权 人 许可 ， 也 没 
有 其 他 法 定 事由 的 情况 下 ， 擅 自 以 营 利 为 目的 实施 专利 的 行为 。 专 利 侵 权 行为 主要 包括 以 下 
方面 。 

(1) 为 生产 经 营 目的 制造 、 使 用 、 销 售 其 专利 产品 ， 或 者 使 用 其 专利 方法 以 及 使 用 、 销 售 
依照 该 专利 方法 直接 获得 的 产品 。 

(2) 为 生产 经 营 目的 制造 、 销 售 其 外 观 设 计 专 利 产 品 。 
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(3) 进口 依照 其 专利 方法 直接 获得 的 产品 。 

(4) 产品 的 包装 上 标明 专利 标记 和 专利 号 。 

(5) 用 非 专利 产品 冒充 专利 产品 的 或 者 用 非 专利 方法 冒充 专利 方法 等 。 

对 未 经 专利 权 人 许可 ， 实 施 其 专利 的 侵权 行为 ， 专 利 权 人 或 者 利害 关系 人 可 以 请 求 专利 管 
理 机 关 处 理 。 在 专利 侵权 纠纷 发 生 后, 专利 权 人 或 者 利害 关系 人 既 可 以 请 求 专利 管理 机 关 处 理 ， 
又 可 以 请 求人 民法 院 审理 。 侵 犯 专利 权 的 诉讼 时 效 为 两 年 ， 自 专利 权 人 或 者 利害 关系 人 知道 或 
者 应 当知 道 侵权 行为 之 日 起 计算 。 如 果 诉 讼 时 效 期 限 届满 ， 专 利 权 人 或 者 利害 关系 人 不 能 再 请 
求人 民法 院 保护 ， 同 时 也 不 能 再 向 专利 管理 机 关 请 求 保护 。 


11.2.5 ”企业 知识 产权 的 保护 


高 新 技术 企业 大 多 是 以 知识 创新 开发 产品 ， 当 知识 产品 进入 市 场 后 ， 则 完全 依赖 于 对 其 知 
识 产 权 的 保护 。 知 识 产权 是 一 种 无 形 的 产权 ， 是 企业 的 重要 财富 ， 应 当 把 保护 软件 知识 产权 作 
为 现代 企业 制度 的 一 项 基本 内 容 。 


1. 知识 产权 的 保护 和 利用 


目前 ， 计 算 机 技术 和 软件 技术 的 知识 产权 法 律 保 护 已 形成 以 《著作 权 法 》 保 护 为 主 ,《 著 作 
权 法 兴 包 括 《 计 算 机 软件 保护 条 例 》) 、《 专 利 法 》、《 商 标 法 》、《 反 不 正当 癌 争 法 》 和 《 合 
同 法 》 实 施 交 叉 和 重 登 保护 为 辅 的 趋势 。 例 如 ， 源 程序 及 设计 文档 作为 软件 的 表现 形式 用 《 著 
作 权 法 》 保 护 ， 同 时 作为 技术 秘密 又 受 《 反 不 正当 竞争 法 》 的 保护 。 由 于 软件 具有 技术 含量 高 
的 特点 ， 使 得 对 软件 法 律 保护 成 为 一 种 综合 性 的 保护 ， 对 于 企业 来 说 ， 仅 依靠 某 项 法 律 或 法 规 
不 能 解决 软件 的 所 有 知识 产权 问题 。 应 在 保护 企业 计算 机 软件 成 果 知 识 产 权 方面 实施 综合 性 的 
保护 ， 例 如 ， 在 新 技术 的 开发 中 重视 技术 秘密 的 管理 ， 也 应 重视 专利 权 的 取得 ， 而 在 命名 新 产 
品名 称 时 ， 也 应 重视 商标 权 的 取得 ， 以 保护 企业 的 知识 产权 。 企 业 软 件 保 护 成 果 知 识 产权 的 一 


般 途 径 如 下 。 
(1) 明确 软件 知识 产权 归属 。 明 确 知识 产权 是 归 企 业 还 是 制作 、 设 计 、 开 发 人 员 所 有 ， 避 
免 企业 内 部 产生 权 属 纠纷 。 


(2) 及 时 对 软件 技术 秘密 采取 保密 措施 。 对 企业 的 软件 产品 或 成 果 中 的 技术 秘密 ， 应 当 及 
时 采取 保密 措施 ， 以 便 把 握 市 场 优势 。 一 旦 发 生 企 业 “技术 秘密 ”被 泄露 的 情况 ， 则 便于 认定 
为 技术 秘密 ， 依 法 追究 泄密 行为 人 的 法 律 责任 ， 保 护 企业 的 权益 。 

(3) 依靠 专利 保护 新 技术 和 新 产品 。 我 国 采 用 的 是 先 申请 原则 ， 如 果 有 相同 技术 内 容 的 专 
利 申 请 ， 只 有 最 先 提出 专利 申请 的 企业 或 者 个 人 才能 获得 专利 权 。 企 业 的 软件 技术 或 者 产品 构 
成 专利 法 律 要 件 的 ， 应 当 尽早 办 理 申 请 专利 权 登 记事 宜 ， 不 能 因 企业 自身 的 延误 ， 造 成 企业 软 
件 成 果 新 颖 性 的 丧失 ， 从 而 失去 申请 专利 的 时 机 。 
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(4) 软件 产品 进入 市 场 之 前 的 商标 权 和 商业 秘密 保护 。 企 业 的 软件 产品 已 经 冠 以 商品 专用 
标识 或 者 服务 标识 ， 要 尽快 完成 商标 或 者 服务 标识 的 登记 注册 ， 保 护 软 件 产品 的 商标 专用 权 。 

(5) 软件 产品 进入 市 场 之 前 进行 申请 软件 著作 权 登 记 。 申 请 软件 著作 权 登 记 以 起 到 公示 的 
作用 。 软 件 著作 权 登 记 只 要 求 软件 的 独创 性 ， 并 不 以 软件 的 技术 水 平 作为 著作 权 是 否 有 效 的 条 
件 ， 不 能 等 到 软件 达到 某 种 技术 水 平 后 再 进行 登记 ， 若 其 他 企业 或 者 个 人 抢先 登记 ， 则 不 利于 
企业 权益 的 保护 。 


2. 建立 经 济 约束 机 制 ， 规 范 调整 各 种 关系 


软件 企业 需要 按照 经 济 合同 规范 各 种 经 济 活动 ， 明 确 权利 与 义务 的 关系 。 建 立 企 业内 部 以 
及 企业 与 外 部 的 各 种 经 济 约束 机 制 。 从 目前 存在 的 比较 突出 的 问题 来 看 ， 软 件 企业 应 建立 以 下 
各 项 合同 规范 。 

(1) 劳动 关系 合同 。 软 件 企业 与 企业 职工 、 外 聘 人 员 之 间 应 建立 合法 的 劳动 关系 ， 以 及 应 
该 就 企业 的 商业 秘密 (技术 秘密 和 经 营 秘密 ) 的 保密 事宜 进行 约定 ， 建 立 劳动 利益 关系 合同 以 
及 保守 企业 商业 秘密 的 协议 。 一 些 目前 不 宜 马 上 实行 劳动 合同 的 单位 ， 也 通过 建立 或 者 健全 本 
单位 的 有 关 规 章 制度 的 方式 进行 过 渡 ， 以 鼓励 企业 员工 的 创造 性 劳动 ， 明 确 企业 开发 过 程 中 产 
生 的 软件 技术 成 果 归 属 关系 ， 以 预防 企业 技术 人 员 流 动 时 造成 的 技术 流失 和 技术 泄密 等 问题 。 

(2) 软件 开发 合同 。 软 件 企 业 与 外 单位 合作 开发 、 委 托 外 单位 开发 软件 时 ， 应 建立 软件 权 
利 归 属 关系 等 事宜 的 协议 ， 可 按照 有 关 规 定 签订 软件 开发 合同 ， 约 定 软件 开发 各 方面 尚未 开发 
的 软件 享有 的 权利 与 义务 的 关系 ， 以 及 软件 技术 成 果 开 发 完成 后 的 权利 归属 关系 和 经 济 利益 关 
系 等 。 如 果 软 件 开发 方 在 合作 中 发 现 了 合同 的 缺陷 ， 应 及 早 对 合同 进行 补充 和 完善 。 

(3) 软件 许可 使 用 (或 者 转让 ) 合同 。 软 件 企业 在 经 营 本 企业 的 软件 产品 时 ,应 当 建 立 “ 许 
可 证 ” (或 是 转让 合同 ) 制度 ， 用 软件 许可 合同 〈 授 权 书 ) 或 者 转让 合同 的 方式 来 明确 规定 软 
件 使 用 权 的 许可 《〈 转 让) 方式、 条件 、 范 围 和 时 间 等 事宜 ， 避 免 因 合同 条 款 的 约定 不 清楚 、 不 
明确 而 导致 当事人 之 间 发 生 扯 皮 等 不 愉快 的 事情 , 或 者 因 合 同 条 款 无 法 界定 而 引发 的 软件 侵权 
纠纷 。 


国医 


古国 第 12 章 软件 系统 分 析 与 设计 若 


软件 设计 师 考试 结合 了 当前 软件 设计 开发 中 的 主流 技术 和 工程 应 用 背景 ， 强 调 了 主流 设计 
技术 的 应 用 问题 ， 读 者 除 应 掌握 基本 的 概念 和 理论 基础 知识 外 ， 还 需要 正确 地 针对 实践 应 用 中 
的 问题 提出 合理 的 解决 方案 ， 将 一 系列 的 设计 方法 与 原则 应 用 在 实际 系统 的 分 析 、 设 计 和 开发 
环节 中 。 编 者 委员 会 总 结 近 几 年 的 软件 设计 师 考试 所 涉及 的 应 用 性 内 容 ， 将 其 主要 技术 领域 归 
纳 为 以 下 几 点 。 

(1) 结构 化 分 析 与 设计 。 

(2) 数据 库 分 析 与 设计 。 

(3) 面向 对 象 分 析 与 设计 。 

(4) 算法 设计 与 C 程序 实现 。 

(5) 面向 对 象 的 程序 设计 与 实现 。 


12.1 结构 化 分 析 与 设计 


Re 


~ 


结构 化 分 析 将 数据 和 处 理 〈 加 工 ) 作为 分 析 对 象 ， 数 据 的 分 析 结 果 表 示 了 现实 世界 中 实体 
的 属性 及 其 之 间 的 相互 关系 ， 而 处 理 的 分 析 结 果 则 展现 了 系统 对 数据 的 加 工 和 转换 。 面 向 数据 
流 建 模 是 目前 仍然 被 广泛 使 用 的 方法 之 一 ， 而 DFD 则 是 面向 数据 流 建 模 中 的 重要 工具 ，DEFD 将 
系统 建 模 成 输入 一 处 理 一 输出 的 模型 ， 即 流入 软件 的 数据 对 象 ， 经 由 处 理 的 转换 ， 最 后 以 结 
果 数 据 对 象 的 形式 流出 软件 。 DFD 使 用 分 层 的 方式 表示 ， 第 一 个 数据 流 模型 有 时 被 称 为 第 0 层 
DFD 或 者 环境 数据 流 图 。 从 整体 上 表现 系统 ， 随 后 的 数据 流 图 将 改进 第 0 层 图 ， 并 增加 细节 
信息 。 

除 DFD 外 ， 在 进行 建 模 时 ， 还 可 结合 数据 字典 和 加 工 处 理 说 明 对 DFD 进行 补充 。 数 据 字 
典 以 一 种 准确 且 无 二 义 的 方式 定义 所 有 被 加 工 引 用 的 数据 流 和 数据 存储 ， 通 常 包 括 数据 流 条 
目 、 数 据 存储 条 目 和 数据 项 条 目 。 数 据 流 条 目 描述 DFD 中 数据 流 的 组 成 ， 数 据 存储 条 目 描述 
DEFD 中 数据 存储 文件 的 组 成 ， 而 数据 项 条 目 则 描述 数据 流 或 数据 存储 中 所 使 用 的 数据 项 。 加 工 
处 理 的 说 明 则 可 采用 结构 化 自然 语言 、 判 定 表 和 判定 树 等 多 种 形式 进行 详细 描述 ， 其 目的 在 于 
说 明 加 工 做 什么 。 

掌握 上 述 的 工具 后 ， 即 可 对 问题 进行 结构 化 的 分 析 ， 其 实施 步骤 如 下 。 

(1) 确定 系统 边界 ， 画 出 系统 环境 图 。 
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(2) 自 项 向 下 画 出 各 层 数据 流 图 。 

(3) 定义 数据 字典 。 

(4) 定义 加 工 说 明 。 

(5) 将 图 、 字 典 以 及 加 工 组 成 分 析 模 型 。 

在 实际 使 用 DFD 进行 数据 流 建 模 时 ， 需 要 注意 以 下 原则 。 

(1) 加 工 和 数据 流 的 正确 使 用 。 如 一 个 加 工 必须 既 有 输入 又 有 输出 ， 数 据 流 只 能 和 加 工 相 
关 ， 即 从 加 工 流向 加 工 、 数 据 源流 向 加 工 或 加 工 流 向 数据 源 。 

(2) 每 个 数据 流 和 数据 存储 都 要 在 数据 字典 中 有 定义 ， 数 据 字 典 包 括 各 层 数 据 流 图 中 数据 
元 素 的 定义 。 

(3) 数据 流 图 中 最 底层 的 加 工 必须 有 加 工 说 明 。 

(4) 父 图 和 子 图 必须 平衡 。 即 父 图 中 某 加 工 的 输入 /输出 (数据 流 ) 和 分 解 这 个 加 工 的 子 图 
的 输入 /输出 数据 流 必须 完全 一 致 。 这 种 一 致 性 不 一 定 要 求 数 据 流 的 名 称 和 个 数 一 一 对 应 , 但 它 
们 在 数据 字典 中 的 定义 必须 一 致 ， 数 据 流 或 数据 项 既 不 能 多 也 不 能 少 。 

(5) 加 工 处 理 说 明和 数据 流 图 中 加 工 涉及 的 元 素 保持 一 致 。 例 如 ， 在 加 工 处 理 说明 中 ， 输 
入 数据 流 必 须 说 明 其 如 何 使 用 ， 输 出 数据 流 说 明 如 何 产生 或 选取 ， 数 据 存储 说 明 如 何 选取 、 使 
用 或 修改 。 

(6) 一 幅 图 中 的 图 元 个 数控 制 在 7 土 2 以 内 。 

DFD、 数 据 字 典 和 加 工 说 明 可 以 充分 地 描述 系统 的 分 析 模 型 ， 其 后 需要 对 分 析 模 型 进行 变 
换 从 而 得 到 系统 的 总 体 设计 模型 。 系 统 总 体 设计 模型 可 以 采用 层次 图 、HIPO 图 和 结构 图 来 表 
达 ， 但 不 论 是 哪 一 种 图 形 工具 ， 都 反映 了 模块 间 的 调用 关系 。 

在 分 析 模 型 的 基础 上 进行 设计 时 ,主要 是 针对 DFD 进行 变换 从 而 得 到 模块 的 调用 关系 图 ， 
因此 ， 需 要 掌握 数据 流 的 变换 设计 与 事务 设计 。 面 向 数据 流 的 设计 方法 把 数据 流 图 映射 成 软件 
结构 , 数据 流 图 的 类 型 决定 了 映射 的 方法 , 数据 流 图 可 分 为 变换 型 数据 流 图 和 事务 型 数据 流 图 。 
变换 型 数据 流 图 具有 明显 的 输入 、 变 换 〈 或 称 主 加 工 )】 和 输出 ， 而 事务 型 数据 流 图 则 是 数据 沿 
输入 通路 到 达 一 个 处 理 时 ， 这 个 处 理 根 据 输入 数据 的 类 型 在 若干 动作 序列 中 选择 一 个 来 执行 。 
变换 设计 的 核心 在 于 确定 输入 流 和 输出 流 的 边界 ， 从 而 孤立 出 变换 中 心 ; 事务 设计 的 核心 在 于 
将 事务 类 型 判断 处 理 变 换 成 调度 模块 以 选择 后 续 的 输出 分 支 模块 。 

经 过 总 体 设计 阶段 的 工作 ， 已 经 确定 了 软件 的 模块 结构 和 接口 描述 ， 但 每 个 模块 仍 被 看 作 
黑 盒子 。 后 续 的 详细 设计 目标 是 确定 怎样 具体 地 实现 所 要 求 的 系统 ， 经 过 详细 设计 ， 可 以 得 出 
对 目标 系统 的 精确 描述 ， 从 而 在 编码 阶段 可 以 将 这 个 描述 直接 翻译 成 用 某 种 程序 设计 语言 书写 
的 程序 。 因 此 ， 详 细 设 计 的 结果 基本 上 决定 了 最 终 的 程序 代码 的 质量 。 详 细 设 计 可 以 采用 程序 
流程 图 、N-S 图 、PAD 图 和 PDL 语言 等 工具 来 表达 。 下 面 通过 一 个 案例 来 说 明 如 何 应 用 结构 化 
分 析 、 总 体 设计 与 详细 设计 技术 。 
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12.1.1 需求 说 明 


图 书 管理 系统 的 主要 功能 包括 图 书 购 入 、 借 阅 、 归 还 以 及 注销 。 管 理 人 员 可 以 查询 读者 、 
图 书 的 借阅 情况 ， 还 可 对 当前 图 书 借阅 情况 进行 统计 ， 给 出 统计 数据 。 简 单 的 图 书 管理 系统 针 
对 图 书 进行 4 个 方面 的 管理 : 购 入 新 书 、 读 者 借 书 、 读 者 还 书 以 及 图 书 注销 。 

购 入 新 书 需要 为 该 书 编制 图 书 卡 片 ， 包 括 分 类 目录 号 、 流 水 号 〈 保 证 每 本 书 都 有 唯一 的 流 
水 号 ， 同 类 图 书 也 是 如 此 )、 书 名 、 作 者 、 内 容 摘要 、 价 格 和 购书 日 期 等 信息 ， 并 将 这 些 信息 
写 入 图 书目 录 文 件 中 。 

读者 借 书 时 需 填写 借 书 单 ， 包 括 读者 号 、 欲 借 图 书 分 类 目录 号 ， 系 统 首先 检查 该 读者 号 是 
否 有 效 ， 若 无 效 ， 则 拒绝 借 书 ， 和 否则 进一步 检查 该 读者 所 借 图 书 是 否 超过 最 大 限制 数 。 若 已 达 
到 最 大 限制 数 ， 则 拒绝 借 书 ; 若 未 达到 最 大 限制 数 ， 读 者 可 以 借 出 该 书 ， 登 记 图 书 分 类 目录 号 、 
读者 号 和 借阅 日 期 等 ， 写 回 到 借 书 文件 中 。 

读者 还 书 时 ， 根 据 图 书 分 类 目录 号 ， 从 借 书 文件 中 读 出 和 该 图 书 相关 的 借阅 记录 ， 标 明 还 
书 日 期 ,再 写 回 借 书 文件 中 。 如 果 图 书 逾期 未 还 ， 则 处 以 相应 罚款 。 

在 某 些 情况 下 ,需要 对 图 书馆 的 图 书 进行 清理 工作 ， 对 一 些 过 时 或 无 继续 保留 价值 的 图 书 
要 注销 ， 这 时 从 图 书 文件 里 删除 相关 记录 。 

查询 要 求 分 为 查询 读者 信息 、 图 书信 息 和 借阅 统计 信息 3 种 。 


12.1.2 ”结构 化 分 析 


结构 化 分 析 的 最 终结 果 需 要 得 到 系统 的 数据 流 图 、 数 据 字 典 和 加 工 说 明 。 根 据 需 求 说 明 ， 
首先 界定 系统 的 边界 。 因 为 购 入 新 书 、 读 者 借 书 、 读 者 还 书 和 图 书 注销 将 来 都 是 由 图 书 管理 员 
来 操作 系统 ， 因 此 图 书 管理 员 将 是 系统 的 外 部 实体 之 一 。 当 读者 借 书 超期 时 ， 系 统 会 给 读者 一 
个 罚款 单 信息 ， 所 以 ， 这 里 可 以 将 系统 时 钟 和 读者 也 作为 系统 的 外 部 实体 之 一 。 当 然 ， 如 果 认 
为 罚款 单 是 由 系统 管理 员 转 交 给 读者 ， 则 可 以 认为 图 书 管理 系统 只 和 管理 员 与 系统 时 钟 进行 交 
互 ， 这 里 采用 第 二 种 观点 。 查 询 要 求 同 样 都 是 由 系统 管理 员 来 操作 ， 由 此 可 以 得 出 系统 不 完整 
的 第 0 层 DFD 数据 流 图 如 图 12-1 所 示 。 


管理 员 图 书 管理 系统 系统 时 钟 


图 12-1 不 完整 的 第 0 层 DFD 图 


在 0 层 DFD 图 上 分 析 外 部 实体 与 系统 间 的 数据 流 ， 因 为 管理 员 的 两 大 工作 任务 是 分 析 管 
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理 任务 和 查询 任务 ， 因 此 管理 员 会 向 系统 输入 管理 请 求 信息 与 查询 请 求 信息 ， 根 据 输入 的 管理 
请 求 ， 系 统 将 会 对 一 些 存储 文件 进行 修改 ， 对 查询 请 求 ， 系 统 则 会 给 出 读者 、 图 书 与 借阅 的 统 
计 信 息 。 系统 时 钟 主要 为 图 书 管理 系统 提供 系统 时 间 。 为 图 12-1 补充 数据 流 所 得 完整 的 0 层 DFD 
数据 流 图 如 图 12-2 所 示 。 


查询 请 求 


管理 请 求 
图 书 管理 系统 系统 时 辣 


统计 信息 


图 12-2 第 0 层 DFD 图 


随后 对 0 层 DFD 数据 流 图 中 的 图 书 管理 系统 进行 进一步 细 化 ， 根 据 需 求 得 知 ， 系 统 主要 
分 为 管理 任务 和 查询 任务 ， 因 此 可 以 将 其 细 化 为 两 个 大 的 处 理 ， 如 图 12-3 所 示 。 


系统 时 间 


统计 信息 
查询 请 求 


罚款 信息 


管理 请 求 


图 12-3 第 1 层 DFD 图 


同样 ， 对 处 理 2 进行 进一步 细 化 ， 管 理 处 理 分 为 购书 、 借 书 、 还 书 和 清理 4 项 任务 ， 因 此 
可 以 将 处 理 2 分 解 为 4 个 处 理 ， 另 外 需要 一 个 单独 的 处 理 根据 管理 请 求 的 类 型 进行 请 求 分 派 。 
细 化 后 的 数据 流 图 如 图 12-4 所 示 。 
同样 的 方法 ， 可 以 对 处 理 1 也 进行 细 化 。 细 化 完成 后 ， 对 得 到 的 数据 流 图 进行 转化 ， 从 而 
形成 系统 的 总 体 设 计 。 但 在 转换 之 前 ， 应 该 对 数据 流 图 中 的 数据 流 采用 数据 字典 进行 详细 的 说 
明 ， 例 如 : 

管理 请 求 = 清理 请 求 | 购书 请 求 | 借 书 请 求 | 还 书 请 求 

清理 请 求 = 图 书 分 类 目录 号 
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对 于 底层 处 理 ， 以 处 理 2.3 为 例 进行 说 明 。 

加 工 编号 : 2.3 

加 工 名 称 : 借 书 

输入 流 : 借 书 请 求 ， 读 者 信息 ， 借 书信 息 

输出 流 : 更 新 库存 信息 ， 借 书信 息 

处 理 风 辑 : 根据 读者 信息 和 借 书信 息 ， 首 先 判断 读者 是 否 合法 ， 判 断 读者 是 否 已 经 超出 借 
阅 图 书 数目 的 最 大 限制 ， 若 都 合法 , 将 借 书 信息 重新 写 入 借 书 文件 中 ,同时 更 新 图 书目 录 文件 。 


清理 请 求 清理 信息 


借 书 请 求 


图 书目 录 文 件 


管理 请 求 


一 还 书 请 求 
色 款 信息 


系统 时 间 


图 12-4 处 理 2 的 第 2 层 DFD 图 


12.1.3 总 体 设计 


由 于 数据 流 呈 现 了 事务 型 的 特性 ， 因 此 可 采用 事务 型 的 变换 方式 对 数据 流 图 进行 变换 ， 得 
到 的 系统 的 总 体 结构 如 图 12-5 所 示 。 

总 体 设计 给 出 了 数据 流 图 中 的 各 个 处 理 转换 为 模块 后 模块 与 模块 之 间 的 调用 关系 , 后 续 需 
要 根据 总 体 设计 给 出 模块 的 详细 设计 。 
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书 管理 系统 


图 12-5 系统 总 体 结构 图 
12.1.4 ”详细 设计 


以 借 书 为 例 ， 采 用 程序 流程 图 的 形式 描述 借 书 模块 的 详细 设计 。 分 析 借 书 的 输入 是 读者 信 
息 和 借 书 信息 ， 需 要 读者 信息 的 读者 借 书 证 号 ， 借 书信 息 给 出 了 读者 已 经 借阅 了 多 少 本 书 ， 如 
果 读 者 借阅 的 书籍 数目 尚未 超出 系统 的 限制 ， 则 允许 继续 借 书 ， 并 把 新 的 借 书 信息 写 入 借 书 文 
件 ; 否则 ， 拒 绝 借 书 。 该 模块 的 详细 流程 图 如 图 12-6 所 示 。 


输入 读者 号 与 图 书 分 类 目录 号 码 


未 超出 借阅 数目 ? 
更 新 借 书 文件 


图 12-6 ” 借 书 模块 流程 图 
完成 对 每 一 个 模块 的 详细 设计 , 即 可 将 详细 设计 转换 为 程序 代码 , 从 而 实现 整个 管理 系统 。 
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12.2 ”数据 库 分 析 与 设计 


数据 库 设 计 属于 系统 设计 的 范畴 。 通 常 把 使 用 数据 库 的 系统 统称 为 数据 库 应 用 系统 ， 把 对 
数据 库 应 用 系统 的 设计 简称 为 数据 库 设 计 。 数 据 库 设 计 的 任务 是 针对 一 个 给 定 的 应 用 环境 ， 在 
给 定 的 (或 选择 的 ) 硬件 环境 和 操作 系统 及 数据 库 管 理 系统 等 软件 环境 下 ， 创 建 一 个 性 能 良好 
的 数据 库 模式 ， 建 立 数据 库 及 其 应 用 系统 ， 使 之 能 有 效 地 存储 和 管理 数据 ， 满 足 各 类 用 户 的 
需求 。 合 理 的 数据 库 结构 是 数据 库 应 用 系统 性 能 良好 的 基础 和 保证 ， 但 数据 库 的 设计 和 开发 却 
是 一 项 庞大 而 复杂 的 工程 。 从 事 数据 库 设计 的 人 员 , 不 仅 要 具备 数据 库 知 识 和 数据 库 设计 技术 ， 
还 要 有 程序 开发 的 实际 经 验 , 掌握 软件 工程 的 原理 和 方法 。 数 据 库 设计 人 员 必 须 深入 应 用 环境 ， 
了 解 用 户 具体 的 专业 业务 。 在 数据 库 设计 的 前 期 和 后 期 ， 与 应 用 单位 人 员 密 切 联系 ,共同 开发 ， 
可 大 大 提高 数据 库 设计 的 成 功率 。 


12.2.1 ”数据 库 设计 的 策略 与 步骤 


1. 数据 库 设 计 的 策略 


数据 库 设 计 的 一 般 策略 有 两 种 ， 自 项 向 下 (Top Down) 和 自 底 向 上 〈Bottom Up)。 自 项 
向 下 是 从 一 般 到 特殊 的 开发 策略 。 它 是 从 一 个 企业 的 高 层 管理 着 手 ， 分 析 企 业 的 目标 、 对 象 和 
策略 ， 构 造 抽象 的 高 层 数 据 模型 。 然 后 逐步 构造 越 来 越 详细 的 描述 和 模型 〈 子 系统 的 模型 )。 
模型 不 断 地 扩展 细 化 ， 直 到 能 识别 特定 的 数据 库 及 其 应 用 为 止 。 

自 底 向 上 的 开发 采用 与 抽象 相反 的 顺序 进行 。 它 从 各 种 基本 业务 和 数据 处 理 着 手 ， 即 从 一 
个 企业 的 各 个 基层 业务 子 系统 的 业务 处 理 开始 ， 进 行 分 析 和 设计 。 然 后 将 各 子 系统 进行 综合 和 
集中 ， 进 行 上 一 层 系统 的 分 析 和 设计 ， 将 不 同 的 数据 进行 综合 。 最 后 得 到 整个 信息 系统 的 分 析 
和 设计 。 这 两 种 方法 各 有 优 缺点 。 在 实际 的 数据 库 设计 开发 过 程 中 ， 常 常 把 这 两 种 方法 综合 起 
来 使 用 。 


2. 数据 库 设计 的 步骤 


多 年 来 ， 人 们 提出 了 多 种 数据 库 设计 方法 、 多 种 设计 准则 和 规范 。1978 年 10 月 召开 的 新 
奥尔良 (New Orleans) 会 议 提出 的 关于 数据 库 设 计 的 步骤 (简称 新 奥尔良 法 ) 是 目前 得 到 公认 
的 ， 较 完整 、 较 权威 的 数据 库 设 计 方 法 ， 它 把 数据 库 设 计 分 为 以 下 4 个 主要 阶段 。 

(1) 用 户 需求 分 析 。 数 据 库 设计 人 员 采 用 一 定 的 辅助 工具 对 应 用 对 象 的 功能 、 性 能 和 限制 
等 要 求 所 进行 的 科学 分 析 。 

(2) 概念 设计 。 概 念 结构 设计 是 对 信息 分 析 和 定义 ， 如 视图 模型 化 、 视 图 分 析 和 汇总 。 该 
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阶段 对 应 用 对 象 精确 地 进行 抽象 和 概括 ， 以 形成 独立 于 计算 机 系统 的 企业 信息 模型 。 描 述 概念 
模型 较 理 想 的 是 采用 E-R 方法 。 

(3) 逻辑 设计 。 将 抽象 的 概念 模型 转化 为 与 选用 的 DBMS 产品 所 支持 的 数据 模型 相符 合 的 
逻辑 模型 ， 它 是 物理 设计 的 基础 ， 包 括 模式 初始 设计 、 子 模式 设计 、 应 用 程序 设计 、 模 式 评价 
以 及 模式 求 精 。 

(4) 物理 设计 。 风 辑 模型 在 计算 机 中 的 具体 实现 方案 。 

当 各 阶段 发 现 不 能 满足 用 户 需 求 时 ， 均 需 返 回 到 前 面 适当 的 阶段 ， 进 行 必 要 的 修正 。 如 此 
经 过 不 断 地 迭代 和 求 精 ， 直 到 各 种 性 能 均 能 满足 用 户 的 需求 为 止 。 


12.2.2 需求 分 析 


需求 分 析 是 在 项 目 确定 之 后 ， 用 户 和 设计 人 员 对 数据 库 应 用 系统 所 要 涉及 的 内 容 (数据 ) 
和 功能 〈 行 为 ) 的 整理 和 描述 ， 是 以 用 户 的 角度 来 认识 系统 。 这 一 过 程 是 后 续 开发 的 基础 ， 以 
后 的 四 辑 设计 和 物理 设计 以 及 应 用 程序 的 设计 都 会 以 此 为 依据 。 


1. 需求 分 析 的 任务 、 目 标 及 方法 


需求 分 析 阶 段 的 任务 : 综合 各 个 用 户 的 应 用 需求 ， 对 现实 世界 要 处 理 的 对 象 组织、 部 门 
和 企业 等 ) 进行 详细 调查 ， 在 了 解 现行 系统 的 情况 ， 确 定 新 系统 功能 的 过 程 中 ， 收 集 支持 系统 
目标 的 基础 数据 及 处 理 方法 。 

参与 需求 分 析 的 主要 人 员 是 分 析 人 员 和 用 户 。 这 是 由 于 数据 库 应 用 系统 是 面向 企业 和 部 门 
的 具体 业务 ， 分 析 人 员 一 般 并 不 了 解 ， 而 同样 用 户 也 不 会 具有 系统 分 析 的 能 力 ， 这 就 需要 双方 
进行 有 效 的 沟通 ， 使 得 设计 人 员 对 用 户 的 各 项 业务 了 解 和 熟 番 ， 进 行 分 析 和 加 工 ， 将 用 户 眼 中 
的 业务 转换 成 为 设计 人 员 所 需要 的 信息 组 织 。 

分 析 和 表达 用 户 需 求 的 方法 主要 包括 自 项 向 下 和 自 底 向 上 两 类 方法 。 自 顶 向 下 的 结构 化 分 
析 (Structured Analysis，SA) 方法 从 最 上 层 的 系统 组 织 机 构 入 手 ， 采 用 逐 层 分 解 的 方式 分 析 系 
统 ， 并 把 每 一 层 用 数据 流 图 和 数据 字典 描述 。 需 求 分 析 的 重点 是 调查 组 织 机 构 情况 、 调 查 各 部 
门 的 业务 活动 情况 、 协 助 用 户 明确 对 新 系统 的 各 种 要 求 、 确 定 新 系统 的 边界 ， 以 此 获得 用 户 对 
系统 的 如 下 要 求 。 

(1) 信息 要 求 。 用 户 需 要 在 系统 中 保存 哪些 信息 , 由 这 些 保 存 的 信息 要 得 到 什么 样 的 信息 ， 
这 些 信息 以 及 信息 间 应 当 满 足 的 完整 性 要 求 。 

(2) 处 理 要 求 。 用 户 在 系统 中 要 实现 什么 样 的 操作 功能 ， 对 保存 信息 的 处 理 过 程 和 方式 ， 
各 种 操作 处 理 的 频 度 、 响应 时 间 要 求 、 处 理 方式 等 以 及 处 理 过 程 中 的 安全 性 要 求 和 完整 性 要 求 。 

(3) 系统 要 求 。 系 统 要 求 包括 安全 性 要 求 、 使 用 方式 要 求 和 可 扩充 性 要 求 。 其 中 ， 安 全 性 
要 求 是 指 系统 有 几 种 用 户 使 用 ， 每 一 种 用 户 的 使 用 权限 如 何 ; 使 用 方式 要 求 是 指 用 户 的 使 用 环 
境 是 什么 ， 平 均 有 多 少 用 户 同时 使 用 ， 最 高 峰 时 有 多 少 用 户 同时 使 用 ， 有 无 查询 相应 的 时 间 要 
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求 等 ， 可 扩充 性 要 求 是 指 对 未 来 功能 、 性 能 和 应 用 访问 的 可 扩充 性 的 要 求 。 
需求 分 析 阶 段 的 工作 以 及 形成 的 相关 文档 〈 作 为 概念 结构 设计 阶段 的 依据 ) 如 图 12-7 所 示 。 


计 
-一 -一 -一 一 一 入 
J 
二 【六 

储 用 户 活动 

数据 流程 

数据 库 设计 用 户 数据 字典 

人 员 


员 


图 12-7 需求 分 析 阶 段 的 工作 


2. 需求 分 析 阶段 的 文档 


需求 调查 所 得 到 的 数据 可 能 是 零碎 的 、 局 部 的 ， 分 析 师 和 设计 人 员 必 须 进一步 分 析 和 表达 用 
户 的 需求 ， 建 立 需 求 说 明文 档 、 数 据 字典 和 数据 流程 图 。 将 需求 调查 文档 化 ， 文 档 既 要 被 用 户 所 
理解 ， 又 要 方便 数据 库 的 概念 结构 设计 。 

数据 流 分 析 是 对 事务 处 理 所 需 的 原始 数据 的 收集 及 经 处 理 后 所 得 数据 及 其 流向 , 一 般 用 数据 
流 图 (DFD) 来 表示 。DFD 不 仅 指出 了 数据 的 流向 ， 而 且 指 出 了 需要 进行 的 事务 处 理 (但 并 不 涉 
及 如 何 处 理 ， 这 是 应 用 程序 的 设计 范畴 )。 除 了 使 用 数据 流 图 、 数 据 字 典 以 外 ， 需 求 分 析 还 可 使 
用 判定 表 、 判 定 树 等 工具 。 下 面 介绍 数据 流 图 和 数据 字典 ， 其 他 工具 的 使 用 可 参见 软件 工程 等 方 
面 的 参考 书 。 

数据 字典 是 各 类 数据 描述 的 集合 ， 它 是 关于 数据 库 中 数据 的 描述 ， 即 元 数据 ， 而 不 是 数据 
本 身 。 如 用 户 将 向 数据 库 中 输入 什么 信息 ， 从 数据 库 中 要 得 到 什么 信息 ， 各 类 信息 的 内 容 和 结 
构 ， 信 息 之 间 的 联系 等 。 数 据 字 典 包括 数据 项 、 数 据 结构 、 数 据 流 、 数 据 存储 和 加 工 5 个 部 分 
(至 少 应 该 包含 每 个 字段 的 数据 类 型 和 在 每 个 表 内 的 主键 、 外 键 )。 

数据 项 描述 = {数据 项 名 ， 数 据 项 含义 说 明 ， 别 名 ， 数 据 类 型 ， 长 度 ， 

取 值 范围 ， 取 值 含义 ， 与 其 他 数据 项 的 逻辑 关系 } 
数据 结构 描述 = {数据 结构 名 ， 含 义 说 明 ， 组 成 : {数据 项 或 数据 结构 }} 
数据 流 描述 = {数据 流 名 ， 说 明 ， 数 据 流 来 源 ， 数 据 流 去 向 ， 
组 成 : {数据 结构 }， 平 均 流量 ， 高 峰 期 流量 } 
数据 存储 描述 = {数据 存储 名 ， 说 明 ， 编 号 ， 流 入 的 数据 流 ， 流 出 的 数据 流 ， 
组 成 : {数据 结构 }， 数 据 量 ， 存 取 方式 } 
加 工 描述 = {加 工 名 ， 说 明 ， 输 入 : {数据 流 }， 输 出 : {数据 流 }， 
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处 理 : { 简 要 说 明 }} 
需求 分 析 阶 段 的 成 果 是 系统 需求 说 明 书 ,主要 包括 数据 流 图 、 数 据 字 典 、 各 种 说 明 性 表格 、 
统计 输出 表 和 系统 功能 结构 图 等 。 系 统 需求 说 明 书 是 以 后 设计 、 开 发 、 测 试 和 验收 等 过 程 的 重 
要 依据 。 关 于 需求 分 析 的 详细 过 程 请 参见 第 5.3 节 。 


12.2.3 ”概念 结构 设计 


数据 库 概 念 结构 设计 阶段 是 在 需求 分 析 的 基础 上 , 依照 需求 分 析 中 的 信息 要 求 对 用 户 信 息 
加 以 分 类 、 聚 集 和 概括 ， 建 立信 息 模 型 ， 并 依照 选 定 的 数据 库 管理 系统 软件 转换 成 为 数据 的 逻 
辑 结构 ， 再 依照 软 /硬件 环境 ， 最 终 实 现 数据 的 合理 存储 ， 这 一 过 程 也 称 为 数据 建 模 。 

数据 库 概 念 结构 设计 的 目标 是 产生 反映 系统 信息 需求 的 数据 库 概念 结构 ， 即 概念 模式 。 概 
念 结构 是 独立 于 支持 数据 库 的 DBMS 和 使 用 的 硬件 环境 的 。 此 时 , 设计 人 员 从 用 户 的 角度 看 待 
数据 以 及 数据 处 理 的 要 求 和 约束 ， 产 生 一 个 反映 用 户 观点 的 概念 模式 ， 然 后 再 把 概念 模式 转换 
为 逻辑 模式 。 

1. 概念 结构 设计 策略 与 方法 


概念 结构 设计 是 设计 人 员 以 用 户 的 观点 对 用 户 信息 的 抽象 和 描述 ， 从 认识 论 的 角度 来 讲 ， 
它 是 从 现实 世界 到 信息 世界 的 第 一 次 抽象 ， 并 不 考虑 具体 的 数据 库 管 理 系统 。 

现实 世界 的 事物 纷繁 复杂 ， 即 使 是 对 某 一 具体 的 应 用 ， 由 于 存在 大 量 不 同 的 信息 和 对 信息 
的 各 种 处 理 ， 也 必须 加 以 分 类 整理 ， 理 清 各 类 信息 之 间 的 关系 ， 描 述 信息 处 理 的 流程 ， 这 一 过 
程 就 是 概念 结构 设计 。 

概念 结构 设计 的 策略 通常 有 以 下 4 种 : 自 顶 向 下 、 自 底 向 上 、 逐 步 扩张 和 混合 策略 。 在 实 
际 应 用 中 这 些 策略 并 没有 严格 的 限定 ， 可 以 根据 具体 业务 的 特点 选择 ， 如 对 于 组 织 机 构 管理 ， 
因 其 固有 的 层次 结构 ， 可 采用 自 项 向 下 的 策略 ， 对 于 已 实现 计算 机 管理 的 业务 ， 通 常 可 以 以 此 
为 核心 ， 采 取 逐 步 扩张 的 策略 。 

概念 结构 设计 最 著名 、 最 常用 的 方法 是 PPS Chen 于 1976 年 提出 的 实体 -联系 
(Entity-Relationship Approach，E-R ) 方法 。 它 采用 E-R 模型 将 现实 世界 的 信息 结构 统一 由 实体 、 
属性 以 及 实体 之 间 的 联系 来 描述 。 

使 用 E-R 方法 ， 无 论 是 哪 种 策略 ， 都 要 对 现实 事物 加 以 抽象 ， 以 E-R 图 的 形式 描述 出 来 。 

2. 用 E-R 方法 建立 概念 模型 


E-R 图 的 设计 要 依照 上 述 的 抽象 机 制 ， 对 需求 分 析 阶 段 所 得 到 的 数据 进行 分 类 、 聚 集 和 概 
括 ， 确 定 实体 、 属 性 和 联系 。 概 念 结构 的 具体 工作 步骤 包括 选择 局 部 应 用 、 逐 一 设计 分 E-R 图 
和 了 -R 图 合并 ， 如 图 12-8 所 示 。 
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图 12-8 ”概念 结构 设计 的 工作 步骤 


(1) 选择 局 部 应 用 。 需 求 分 析 阶 段 会 得 到 大 量 的 数据 ， 这 些 数据 分 散 杂 乱 ， 许 多 数据 会 应 
用 于 不 同 的 处 理 ， 数 据 与 数据 之 间 关 联 关系 也 较为 复杂 ， 要 最 终 确定 实体 、 属 性 和 联系 ， 就 必 
须根 据 数据 流 图 这 一 线索 理 清 数据 。 

数据 流 图 是 对 业务 处 理 过 程 从 高 层 到 底层 的 一 级 抽象 ， 高 层 抽象 流 图 一 般 反 映 系统 的 概 
貌 ， 对 数据 的 引用 较为 笼统 ， 而 底层 又 可 能 过 于 细致 ， 不 能 体现 数据 的 关联 关系 ， 因 此 要 选择 
适当 层次 的 数据 流 图 ， 让 这 一 层 的 每 一 部 分 对 应 一 个 局 部 应 用 ， 实 现 某 一 项 功能 。 从 这 一 层 入 
手 ， 就 能 很 好 地 设计 分 E-R 图 。 

(2) 逐一 设计 分 E-R 图 。 划 分 好 各 个 局 部 应 用 之 后 ， 就 要 对 每 一 个 局 部 应 用 逐一 设计 分 E-R 
图 ， 又 称 为 局 部 E-R 图 。 对 于 每 一 局 部 应 用 ， 其 所 用 到 的 数据 都 应 该 收集 在 数据 字典 中 ， 依 照 
该 局 部 应 用 的 数据 流 图 ， 从 数据 字典 中 提取 出 数据 ， 使 用 抽象 机 制 确定 局 部 应 用 中 的 实体 、 实 
体 的 属性 、 实 体 标识 符 及 实体 间 的 联系 及 其 类 型 。 

事实 上 ， 在 形成 数据 字典 的 过 程 中 ， 数 据 结 构 、 数 据 流 和 数据 存储 都 是 根据 现实 事物 来 确 
定 的 ， 因 此 都 已 经 基本 上 对 应 了 实体 及 其 属性 ， 以 此 为 基础 ， 加 以 适当 调整 ， 增 加 联系 及 其 类 
型 ， 就 可 以 设计 分 E-R 图 。 

现实 生活 中 ， 许 多 事物 作为 实体 还 是 属性 没有 明确 的 界定 ， 这 需要 根据 具体 情况 而 定 ， 一 
般 遵 循 以 下 两 条 准则 。 

Q@ 属性 不 可 再 分 ， 即 属性 不 再 具有 需要 描述 的 性 质 ， 不 能 有 属性 的 属性 。 

@ 属性 不 能 与 其 他 实体 发 生 联 系 ， 联 系 是 实体 与 实体 间 的 联系 。 

(3) E-R 图 合并 。 根 据 局 部 应 用 设计 好 各 局 部 E-R 图 之 后 ， 就 可 以 对 各 分 E-R 图 进行 合 
并 。 合并 的 目的 在 于 在 合并 过 程 中 解决 分 E-R 图 中 相互 间 存在 的 冲突 ， 消除 分 E-R 图 之 间 存 在 
的 信息 宛 余 , 使 之 成 为 能 够 被 全 系统 所 有 用 户 共同 理解 和 接受 的 统一 的 、 精炼 的 全 局 概念 模型 。 
合并 的 方法 是 将 具有 相同 实体 的 两 个 或 多 个 E-R 图 合 而 为 一 , 在 合成 后 的 E-R 图 中 把 相同 实体 
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用 一 个 实体 表示 ,合成 后 的 实体 的 属性 是 所 有 分 ER 图 中 该 实体 的 属性 的 并 集 ， 并 以 此 实体 为 
中 心 ， 并 入 其 他 所 有 分 ER 图 。 再 把 合成 后 的 E-R 图 以 分 ER 图 看 待 ， 合 并 剩余 的 分 ER 图 ， 
直到 所 有 的 E-R 图 全 部 合并 ， 就 构成 一 张 全 局 ER 图 。 

分 ER 图 之 间 的 冲突 主要 有 以 下 三 类 。 

@ 属性 冲突 。 同 一 属性 可 能 会 存在 于 不 同 的 分 ER 图 ， 由 于 设计 人 员 不 同 或 是 出 发 点 不 同 
对 属性 的 类 型 、 取 值 范围 和 数据 单位 等 可 能 会 不 一 致 ， 这 些 属性 对 应 的 数据 将 来 只 能 以 一 种 形式 
在 计算 机 中 存储 ， 这 就 需要 在 设计 阶段 进行 统一 。 

@ 命名 冲突 。 相 同意 义 的 属性 在 不 同 的 分 E-R 图 上 有 着 不 同 的 命名 ， 或 是 名 称 相同 的 属 
性 在 不 同 的 分 E-R 图 中 代表 着 不 同 的 意义 ， 这 些 也 要 进行 统一 。 

@ 结构 冲突 。 同 一 实体 在 不 同 的 分 E-R 图 中 有 不 同 的 属性 ， 同 一 对 象 在 某 一 分 E-R 图 中 
被 抽象 为 实体 ， 而 在 另 一 分 E-R 图 中 又 被 抽象 为 属性 ， 需 要 统一 。 

分 E-R 图 的 合并 过 程 中 要 对 其 进行 优化 ， 具 体 可 以 从 以 下 三 个 方面 实现 。 

@ 实体 类 型 的 合并 。 两 个 具有 1 : 1 联系 或 1 : n 联系 的 实体 可 以 予以 合并 ， 使 实体 个 数 减 
少 ， 有 利于 减少 将 来 数据 库 操作 过 程 中 的 连接 开销 。 

@ 元 余 属性 的 消除 。 一 般 在 各 分 E-R 图 中 的 属性 是 不 存在 宛 余 的 ， 但 合并 后 就 可 能 出 现 元 
余 。 因 为 合并 后 的 E-R 图 中 的 实体 继承 了 合并 前 该 实体 在 分 E-R 图 中 的 全 部 属性 , 属性 间 就 可 能 
存在 元 余 ， 即 某 一 属性 可 以 由 其 他 属性 确定 。 

@ 宛 余 联系 的 消除 。 在 分 E-R 图 合并 的 过 程 中 可 能 会 出 现实 体 联系 的 环 状 结构 ， 即 某 一 实 
体 和 与 另 一 实体 B 间 有 直接 联系 ， 同 时 A 又 通过 其 他 实体 与 实体 B 发 生 间接 联系 。 通 常 ， 直 接 
联系 可 以 通过 间接 联系 所 表达 ， 可 消除 直接 联系 。 
12.2.4 ”逻辑 结构 设计 


逻辑 结构 设计 即 是 在 概念 结构 设计 的 基础 上 进行 数据 模型 设计 ， 可 以 是 层次 模型 、 网 状 模 
型 和 关系 模型 ， 本 节 介绍 如 何在 全 局 E-R 图 基础 上 进行 关系 模型 的 逻辑 结构 设计 。 逻 辑 结构 设 
计 阶 段 的 主要 工作 步骤 包括 确定 数据 模型 、 将 E-R 图 转换 成 为 指定 的 数据 模型 、 确 定 完 整 性 约 
束 和 确定 用 户 视图 ， 如 图 12-9 所 示 。 


1. E-R 图 关系 模式 的 转换 
E-R 方法 所 得 到 的 全 局 概念 模型 是 对 信息 世界 的 描述 ， 并 不 适用 于 计算 机 处 理 ， 为 适合 关 


系数 据 库 系 统 的 处 理 ， 必 须 将 E-R 图 转换 成 关系 模式 。E-R 图 是 由 实体 、 属 性 和 联系 三 要 素 构 
成 ， 而 关系 模型 中 只 有 唯一 的 结构 一 一 关系 模式 ， 通 常 采 用 以 下 方法 加 以 转换 。 
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基本 E-R 图 刘强 模型 


图 12-9 逻辑 结构 设计 的 工作 步骤 


1) 实体 向 关系 模式 的 转换 

将 E-R 图 中 的 实体 逐一 转换 成 为 一 个 关系 模式 ， 实 体 名 对 应 关系 模式 的 名 称 ， 实 体 的 属性 
转换 成 关系 模式 的 属性 ， 实 体 标识 符 就 是 关系 的 码 〈 键 )。 

2) 联系 向 关系 模式 的 转换 

E-R 图 中 的 联系 有 3 种 : 一 对 一 联系 (1 : 1)、 一 对 多 联系 (1 : n) 和 多 对 多 联系 (m : m)， 
针对 这 3 种 不 同 的 联系 ， 转 换 方 法 如 下 。 

(1) 一 对 一 联系 的 转换 。 一 对 多 联系 有 两 种 方式 向 关系 模式 进行 转换 。 一 种 方式 是 将 联系 
转换 成 一 个 独立 的 关系 模式 ， 关 系 模式 的 名 称 取 联 系 的 名 称 ， 关 系 模式 的 属性 包括 该 联系 所 关 
联 的 两 个 实体 的 码 及 联系 的 属性 ， 关 系 的 码 取 自任 一 方 实体 的 码 ; 另 一 种 方式 是 将 联系 归并 到 
关联 的 两 个 实体 的 任 一 方 ， 给 待 归并 的 一 方 实体 属性 集中 增加 另 一 方 实体 的 码 和 该 联系 的 属性 
即 可 ， 归 并 后 的 实体 码 保持 不 变 。 

(2) 一 对 多 联系 的 转换 。 一 对 多 联系 有 两 种 方式 向 关系 模式 进行 转换 。 一 种 方式 是 将 联系 
转换 成 一 个 独立 的 关系 模式 ， 关 系 模 式 的 名 称 取 联系 的 名 称 ， 关 系 模式 的 属性 取 该 联系 所 关联 
的 两 个 实体 的 码 及 联系 的 属性 ， 关 系 的 码 是 多 方 实体 的 码 ， 另 一 种 方式 是 将 联系 归并 到 关联 的 
两 个 实体 的 多 方 ， 给 待 归并 的 多 方 实体 属性 集中 增加 一 方 实体 的 码 和 该 联系 的 属性 即 可 ， 归 并 
后 的 多 方 实体 码 保持 不 变 。 

(3) 多 对 多 联系 的 转换 。 多 对 多 联系 只 能 转换 成 一 个 独立 的 关系 模式 ， 关 系 模式 的 名 称 取 
联系 的 名 称 ， 关 系 模式 的 属性 取 该 联系 所 关联 的 两 个 多 方 实体 的 码 及 联系 的 属性 ， 关 系 的 码 是 
多 方 实体 的 码 构成 的 属性 组 。 


2. 关系 模式 的 规范 化 


由 了-R 图 转换 所 得 的 初始 关系 模式 并 不 一 定 能 完全 符合 要 求 ， 还 可 能 会 有 数据 见 余 、 更 新 
异常 存在 ， 这 就 需要 经 过 进一步 的 规范 化 处 理 ， 具 体 步 骤 如 下 。 
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(1) 根据 语义 确定 各 关系 模式 的 数据 依赖 。 在 设计 的 前 一 阶段 ， 只 是 从 关系 及 其 属性 来 描 
述 关系 模式 ， 并 没有 考虑 到 关系 模式 中 的 数据 依赖 。 关 系 模式 包含 着 语义 ， 要 根据 关系 模式 所 
描述 的 自然 语义 写 出 关系 数据 依赖 。 

(2) 根据 数据 依赖 确定 关系 模式 的 范式 。 由 关系 的 码 及 数据 依赖 ， 根 据 规范 化 理论 ， 就 可 
以 确定 关系 模式 所 属 的 范式 ， 判 定 关 系 模式 是 否 符合 要 求 ， 即 是 否 达到 了 3NF 或 4NF。 

(3) 如 果 关 系 模式 不 符合 要 求 , 要 根据 关系 模式 的 分 解 算法 对 其 进行 分 解 , 达到 3NF、BCNF 
或 4NF。 

(4) 关系 模式 的 评价 及 修正 。 根 据 规范 化 理论 对 关系 模式 分 解 之 后 ， 就 可 以 在 理论 上 消除 
宛 余 和 更 新 异常 。 但 根据 处 理 要 求 ， 可 能 还 需要 增加 部 分 宛 余 以 满足 处 理 要 求 ， 这 就 需要 做 部 
分 关系 模式 的 处 理 ， 分 解 、 合 并 或 增加 宛 余 属性 ， 提 高 存储 效率 和 处 理 效率 。 


3. 确定 完整 性 约束 


根据 规范 化 理论 确定 了 关系 模式 之 后 ， 还 要 对 关系 模式 加 以 约束 ， 包 括 数 据 项 的 约束 、 表 
级 约束 及 表 间 约束 ， 可 以 参照 SQL 标准 来 确定 不 同 的 约束 ， 如 检查 约束 、 主 码 约束 和 参照 完整 
性 约束 ， 以 保证 数据 的 正确 性 。 


4. 用 户 视 图 的 确定 


确定 了 整个 系统 的 关系 模式 之 后 ， 还 要 根据 数据 流 图 及 用 户 信息 建立 视图 模式 ， 提 高 数据 
的 安全 性 和 独立 性 。 

(1) 根据 数据 流 图 确定 处 理 使 用 的 视图 。 数 据 流 图 是 某 项 业务 的 处 理 ， 使 用 了 部 分 数据 ， 
这 些 数 据 可 能 要 跨越 不 同 的 关系 模式 ， 建 立 该 业务 的 视图 ， 可 以 降低 应 用 程序 的 复杂 性 ， 并 提 
高 数据 的 独立 性 。 

(2) 根据 用 户 类 别 确定 不 同 用 户 使 用 的 视图 。 不 同 的 用 户 可 以 处 理 的 数据 可 能 只 是 整个 系 
统 的 部 分 数据 ， 而 确定 关系 模式 时 并 没有 考虑 这 一 因素 ， 如 学 校 的 学 生 管理 ， 不 同 的 院 系 只 能 
访问 和 处 理 自己 的 学 生 信息 ， 这 就 需要 建立 针对 不 同 院 系 的 视图 达到 这 一 要 求 ， 这 样 可 以 在 一 
定 程度 上 提高 数据 的 安全 性 。 


12.2.5 ”数据库 的 物理 设计 


数据 库 系 统 实现 是 高 不 开具 体 的 计算 机 的 ， 在 实现 数据 库 逻 辑 结构 设计 之 后 ， 就 要 确定 数 
据 库 在 计算 机 中 的 具体 存储 。 数据库 在 物理 设备 上 的 存储 结构 与 存 取 方 法 称 为 数据 库 的 物理 结 
构 ， 它 依赖 于 给 定 的 计算 机 系统 。 为 一 个 给 定 的 逻辑 数据 模型 设计 一 个 最 适合 应 用 要 求 的 物理 
结构 的 过 程 ， 就 是 数据 库 的 物理 设计 。 

在 数据 库 的 物理 结构 中 ， 数 据 的 基本 单位 是 记录 ， 记 录 是 以 文件 的 形式 存储 的 ， 一 条 存储 
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记录 就 对 应 着 关系 模式 中 的 一 条 逻辑 记录 。 在 文件 中 还 要 存储 记录 的 结构 ， 如 各 字段 长 度 、 记 
录 长 度 等 ， 增 加 必要 的 指针 及 存储 特征 的 描述 。 

数据 库 的 物理 设计 是 离 不 开具 体 的 DBMS 的 ， 不 同 DBMS 对 物理 文件 存 取 方式 的 支持 不 
同 , 设计 人 员 必 须 充 分 了 解 所 用 DBMS 的 内 部 特征 , 根据 系统 的 处 理 要 求 和 数据 的 特点 来 确定 
物理 结构 。 数 据 库 的 物理 设计 工作 过 程 如 图 12-10 所 示 。 


施 
7— 
i 和 [于 记录 存放 位 和 
妃子 模式 和 
图 12-10 数据库 的 物理 设计 工作 过 程 
一 般 来 说 ， 物 理 设计 包括 确定 数据 分 布 、 存 储 结构 和 访问 方式 的 工作 。 
1. 确定 数据 分 布 


从 企业 计算 机 应 用 环境 出 发 ， 需 要 确定 数据 是 集中 管理 还 是 分 布 式 管理 。 目 前 ， 企 业内 部 网 
及 因特网 的 应 用 越 来 越 广泛 ， 大 多 采用 分 布 式 管理 。 对 于 数据 如 何 分 布 需要 从 以 下 几 个 方面 考虑 。 

(1) 根据 不 同 应 用 分 布 数据 。 企 业 的 不 同 部 门 一 般 会 使 用 不 同 数据 ， 将 与 部 门 应 用 相关 的 
数据 存储 在 相应 的 场地 ， 使 得 不 同 的 场地 上 处 理 不 同 的 业务 ， 对 于 应 用 多 个 场地 的 业务 ， 可 以 
通过 网 络 进行 数据 处 理 。 

(2) 根据 处 理 要 求 确定 数据 的 分 布 。 对 于 不 同 的 处 理 要 求 ， 也 会 有 不 同 的 使 用 频 度 和 响应 
时 间 ， 对 于 使 用 频 度 高 、 响 应 时 间 短 的 数据 ， 应 存储 在 高 速 设备 上 。 

(3) 对 数据 的 分 布 存 储 必然 会 导致 数据 的 逻辑 结构 的 变化 ， 要 对 关系 模式 做 新 的 调整 ， 回 
到 数据 库 逻 辑 设 计 阶段 做 必要 的 修改 。 

2. 确定 数据 的 存储 结构 

存储 结构 具体 指数 据 文件 中 记录 之 间 的 物理 结构 。 在 文件 中 , 数据 是 以 记录 为 单位 存储 的 ， 
可 以 是 顺序 存储 、 哈 希 存 储 、 堆 存储 和 B'* 树 存储 等 ， 要 根据 数据 的 处 理 要 求 和 变更 频 度 选 定 合 


理 的 物理 结构 。 
为 提高 数据 的 访问 速度 ， 通 常会 采用 索引 技术 。 在 物理 设计 阶段 ， 要 根据 数据 处 理 和 修改 
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要 求 ， 确 定数 据 库 文件 的 索引 字段 和 索引 类 型 。 
3. 确定 数据 的 访问 方式 


数据 的 访问 方式 是 由 其 存储 结构 所 决定 的 ， 采 用 什么 样 的 存储 结构 ， 就 使 用 什么 样 的 访问 
方式 。 数据库 物理 结构 主要 由 存储 记录 格式 、 记 录 在 物理 设备 上 的 安排 及 访问 路 径 〈 存 取 方 法 ) 
等 构成 。 

1) 存储 记录 结构 设计 

存储 记录 结构 包括 记录 的 组 成 、 数 据 项 的 类 型 、 长 度 和 数据 项 间 的 联系 ， 以 及 逻辑 记录 到 存 
储 记录 的 映射 。 在 设计 记录 的 存储 结构 时 ， 并 不 改变 数据 库 的 逻辑 结构 ， 但 可 以 在 物理 上 对 记录 
进行 分 割 。 数据库 中 数据 项 的 被 访问 频率 是 很 不 均匀 的 , 基本 上 符合 公认 的 “80/20 规则 ” 即 “ 从 
数据 库 中 检索 的 80% 的 数据 由 其 中 的 20% 的 数据 项 组 成 ”。 

当 多 个 用 户 同时 访问 常用 数据 项 时 ,会 因 访 盘 冲 突 而 等 待 。 如 果 将 这 些 数据 分 布 在 不 同 的 
磁盘 组 上 ， 当 用 户 同时 访问 时 ， 系 统 就 可 并 行 地 执行 JO， 减 少 访 盘 冲 突 ， 提 高 数据 库 的 性 能 。 
所 以 对 于 常用 关系 ， 最 好 将 其 水 平分 割 成 多 个 裂片 ， 分 布 到 多 个 磁盘 组 上 ， 以 均衡 各 个 磁盘 组 
的 负荷 ， 发 挥 多 磁盘 组 并 行 操作 的 优势 。 

2) 存储 记录 布局 

存储 记录 的 布局 ， 就 是 确定 数据 的 存放 位 置 。 存 储 记录 作为 一 个 整体 ， 如 何 分 布 在 物理 区 
域 上 ， 是 数据 库 物 理 结构 设 计 的 重要 一 环 。 聚 簇 功 能 可 以 大 大 提高 按 聚 簇 码 进行 查询 的 效率 。 
聚 筷 功 能 不 仅 可 用 于 单个 关系 ， 也 适用 于 多 个 关系 。 设 有 职工 表 和 部 门 表 ， 其 中 部 门 号 是 这 两 
个 表 的 公共 属性 。 如 果 查 询 涉及 这 两 个 表 的 连接 操作 ， 可 以 把 部 门 号 相同 的 职工 元 组 和 部 门 元 
组 在 物理 上 聚 簇 在 一 起 ， 既 可 显著 提高 连接 操作 的 速度 ， 又 可 节省 存储 空间 。 建 立 聚 簇 索引 的 
原则 如 下 。 

(1) 肾 簇 码 的 值 相 对 稳定 ， 没 有 或 很 少 需 要 进行 修改 。 

(2) 表 主 要 用 于 查询 ， 并 且 通 过 聚 簇 码 进行 访问 或 连接 是 该 表 的 主要 应 用 。 

(3) 对 应 每 个 聚 簇 码 值 的 平均 元 组 数 既 不 太 多 ， 也 不 太 少 。 

任何 事物 都 有 两 面 性 ， 聚 徐 对 于 某 些 特定 的 应 用 可 以 明显 地 提高 性 能 ， 但 对 于 与 聚 簇 码 无 
关 的 查询 却 毫 无 益处 。 相 反 地 ， 当 表 中 数据 有 插入 、 删 除 、 修 改 时 ， 关 系 中 的 有 些 元 组 就 要 被 
搬 动 后 重新 存储 ， 建 立 聚 簇 的 维护 代价 很 大 。 

3) 存 取 方法 的 设计 

存 取 方 法 是 为 存储 在 物理 设备 (通常 是 外 存储 器 ) 上 的 数据 提供 存储 和 检索 的 能 力 。 存 取 
方法 包括 存储 结构 和 检索 机 制 两 部 分 。 存 储 结构 限定 了 可 能 访问 的 路 径 和 存储 记录 ; 检索 机 制 
定义 每 个 应 用 的 访问 路 径 。 

存 取 方 法 是 快速 存 取 数据 库 中 数据 的 技术 。 数 据 库 系统 是 多 用 户 共享 系统 ， 对 同一 个 关系 


国 27 国 


国 zs 荐 。 软 人 设计 师 教程 (第 5 版 ) 


建立 多 条 存 取 路 径 才 能 满足 多 用 户 的 多 种 应 用 要 求 。 为 关系 建立 多 种 存 取 路 径 是 数据 库 物理 设 
计 的 另 一 个 任务 , 在 数据 库 中 建立 存 取 路 径 最 普遍 的 方法 是 建立 索引 。 确定 索引 的 一 般 顺 序 如 下 。 

(1) 首先 可 确定 关系 的 存储 结构 ， 即 记录 的 存放 是 无 序 的 ， 还 是 按 某 属性 〈 或 属性 组 ) 聚 
簇 存放 。 由 于 在 前 面 已 讨论 过 ， 这 里 不 再 重复 。 

(2) 确定 不 宜 建 立 索 引 的 属性 或 表 。 对 于 太 小 的 表 、 经 常 更 新 的 属性 或 表 、 属 性 值 很 少 的 
表 、 过 长 的 属性 、 一 些 特殊 数据 类 型 的 属性 〈 大 文本 、 多 媒体 数据 ) 和 不 出 现 或 很 少 出 现在 查 
询 条 件 中 的 属性 不 宜 建立 索引 。 

(3) 确定 宜 建立 索引 的 属性 。 例 如 关系 的 主 码 或 外 部 码 、 以 查询 为 主 或 只 读 的 表 、 范 围 查 
询 、 聚 集 函 数 〈Min、Max、Avg、Sum、Count) 或 需要 排序 输出 的 属性 可 以 考虑 建立 索引 。 

索引 一 般 还 需 在 数据 库 运 行 测试 后 ， 再 加 以 调整 。 在 RDBMS 中 ， 索 引 是 改善 存 取 路 径 的 
重要 手段 。 使 用 索引 的 最 大 优点 是 可 以 减少 检索 的 CPU 服务 时 间 和 IO 服务 时 间 ， 改 善 检索 效 
率 。 但 是 ， 不 能 对 进行 频繁 存储 操作 的 关系 建立 过 多 的 索引 ， 因 为 过 多 的 索引 也 会 影响 存储 操 
作 的 性 能 。 


12.2.6 数据库 的 实施 与 维护 


在 数据 库 正 式 投入 运行 之 前 ， 还 需要 完成 很 多 工作 。 例 如 ， 在 模式 和 子 模式 中 加 入 数据 库 
安全 性 、 完 整 性 的 描述 ， 完 成 应 用 程序 和 加 载 程序 的 设计 ， 数 据 库 系 统 的 试 运行 ， 并 在 试 运行 
中 对 系统 进行 评价 。 如 果 评 价 结果 不 能 满足 要 求 ， 还 需要 对 数据 库 进行 修正 设计 ， 直 到 满意 为 
止 。 数 据 库 正式 投入 使 用 ， 也 并 不 意味 着 数据 库 设计 生命 周期 的 结束 ， 而 是 数据 库 维护 阶段 的 
开始 。 数 据 库 实 施 阶段 的 工作 过 程 如 图 12-11 所 示 。 


物理 模型 EE 一 - 
(CD) 存储 记录 格式 | | 
(2) 记 录 存 放 位 置 数据 库 
(3) 存 取 方法 


图 12-11 数据 库 实施 阶段 的 工作 过 程 


1. 数据 库 的 实施 
根据 逻辑 和 物理 设计 的 结果 在 计算 机 上 建立 起 实际 的 数据 库 结构 并 装 入 数据 进行 试 运行 
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和 评价 的 过 程 叫 作 数 据 库 的 实施 (或 实现 )。 

1) 建立 实际 的 数据 库 结构 

用 DBMS 提供 的 数据 定义 语言 (DDL) 编写 描述 逻辑 设计 和 物理 设计 结果 的 程序 (一般 称 
为 数据 库 脚 本 程序 )， 经 计算 机 编译 处 理 和 执行 后 ， 就 生成 了 实际 的 数据 库 结 构 。 所 用 DBMS 
的 产品 不 同 ， 描 述 数据 库 结构 的 方式 也 不 同 。 有 的 DBMS 提供 数据 定义 语言 ， 有 的 提供 数据 库 
结构 的 图 形 化 定义 方式 ， 有 的 两 种 方法 都 提供 。 在 定义 数据 库 结 构 时 ， 应 包含 以 下 内 容 。 

(1) 数据 库 模 式 与 子 模式 ， 以 及 数据 库 空 间 等 的 描述 。 例 如 ， 在 Oracle 系统 中 ,数据库 好 
辑 结果 的 描述 包括 表 空 间 (Tablespace)、 段 (Segment)、 范 围 (Extent) 和 数据 块 (Data block)。 
DBA 或 设计 人 员 通 过 对 数据 库 空 间 的 管理 和 分 配 , 可 控制 数据 库 中 数据 的 磁盘 分 配 , 将 确定 的 
空间 份额 分 配给 数据 库 用 户 ， 控 制 数 据 的 可 用 性 ， 将 数据 存储 在 多 个 设备 上 ， 以 提高 数据 库 性 
能 等 。 

(2) 数据 库 完整 性 描述 。 所 谓 数据 的 完整 性 ， 是 指数 据 的 有 效 性 、 正 确 性 和 一 致 性 。 在 数 
据 库 设计 时 ， 如 果 没 有 一 定 的 措施 确保 数据 库 中 数据 的 完整 性 ， 就 无 法 从 数据 库 中 获得 可 信 的 
数据 。 数 据 的 完整 性 设计 ， 应 该 贯穿 在 数据 库 设计 的 全 过 程 中 。 例 如 ， 在 数据 需求 分 析 阶 段 ， 
收集 数据 信息 时 , 应 该 向 有 关 用 户 调查 该 数据 的 有 效 值 范围 。 在 模式 与 子 模式 中 , 可 以 用 DBMS 
提供 的 DDL 语句 描述 数据 的 完整 性 。 

(3) 数据 库 安全 性 描述 。 数 据 安全 性 设计 同 数据 完整 性 设计 一 样 ， 也 应 在 数据 库 设计 的 各 
个 阶段 加 以 考虑 。 在 进行 需求 分 析 时 ， 分 析 人 员 除 了 收集 数据 及 数据 间 联 系 的 信息 之 外 ， 还 必 
须 收 集 关 于 数据 的 安全 性 说 明 。 在 设计 数据 库 逻 辑 结构 时 ， 对 于 保密 级 别 高 的 数据 ， 可 以 单独 
进行 设计 。 子 模式 是 实现 安全 性 要 求 的 一 个 重要 手段 ， 可 以 为 不 同 的 应 用 设计 不 同 的 子 模式 。 
在 数据 操纵 上 ， 系 统 可 以 对 用 户 的 数据 操纵 进行 两 方面 的 控制 : 一 是 给 合法 用 户 授权 ， 有 目前 主 
要 有 身份 验证 和 口令 识别 ; 二 是 给 合法 用 户 不 同 的 存 取 权限 。 

(4) 数据 库 物 理 存 储 参数 描述 。 物 理 存 储 参数 因 DBMS 的 不 同 而 不 同 。 一 般 可 设置 的 参数 
包括 块 大 小 、 页 面 大 小 〈 字 节 数 或 块 数 )、 数 据 库 的 页 面 数 、 缓 冲 区 个 数 、 缓 冲 区 大 小 和 用 户 
数 等 。 详 细 内 容 请 参考 DBMS 的 用 户 手册 。 

2) 数据 的 加 载 

数据 库 应 用 程序 的 设计 应 该 与 数据 库 设 计 同 时 进行 。 一 般 地 ， 应 用 程序 的 设计 应 该 包括 数 
据 库 加 载 程序 的 设计 。 在 数据 加 载 前 ， 必 须 对 数据 进行 整理 。 由 于 用 户 缺 乏 计 算 机 应 用 背景 的 
知识 ， 常 常 不 了 解数 据 的 准确 性 对 数据 库 系统 正常 运行 的 重要 性 ， 因 而 未 对 提供 的 数据 作 严格 
的 检查 。 所 以 ， 在 数据 加 载 前 要 建立 严格 的 数据 登录 、 输 入 和 校 验 规范 ， 设 计 完 善 的 数据 校 验 
与 校正 程序 ， 排 除 不 合格 数据 。 

数据 加 载 分 为 手工 输入 和 使 用 数据 转换 工具 两 种 。 现 有 的 DBMS 都 提供 了 DBMS 之 间 数 
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据 转换 的 工具 。 如 果 用 户 原来 就 使 用 数据 库 系 统 ， 可 以 利用 新 系统 的 数据 转换 工具 。 先 将 原 系 
统 中 的 表 转 换 成 新 系统 中 相同 结构 的 临时 表 ， 然 后 对 临时 表 中 的 数据 进行 处 理 后 插入 到 相应 表 
中 。 另 外 ， 由 于 还 需要 对 数据 库 系 统 进行 联合 调试 ， 所 以 大 部 分 的 数据 加 载 工 作 应 在 数据 库 的 
试 运行 和 评价 工作 中 分 批 进行 。 

3) 数据 库 的 试 运行 和 评价 

当 加 载 了 部 分 必须 的 数据 和 应 用 程序 后 ， 就 可 以 开始 对 数据 库 系统 进行 联合 调试 ， 称 为 数 
据 库 的 试 运行 。 一 般 将 数据 库 的 试 运行 和 评价 结合 起 来 ， 目 的 是 测试 应 用 程序 的 功能 ， 测 试 数 
据 库 的 运行 效率 是 否 达 到 设计 目标 ， 是 否 为 用 户 所 容忍 。 测 试 的 目的 是 为 了 发 现 问题 ， 而 不 是 
为 了 说 明 能 达到 哪些 功能 。 因 此 ， 测 试 中 一 定 要 有 非 设计 人 员 的 参与 。 

2. 数据 库 的 维护 


只 有 数据 库 顺 利 地 进行 了 实施 ， 才 可 将 系统 交付 使 用 。 数 据 库 一 旦 投入 运行 ， 就 标志 着 数 
据 库 维护 工作 的 开始 。 数据 库 维护 工作 的 内 容 主要 包括 对 数据 库 的 监测 和 性 能 改善 、 故 障 恢复 、 
数据 库 的 重组 和 重 构 。 在 数据 库 运 行 阶段 ， 对 数据 库 的 维护 主要 由 DBA 完成 。 

(1) 对 数据 库 性 能 的 监测 和 改善 。 性 能 可 以 用 处 理 一 个 事务 的 IO 量 、CPU 时 间 和 系统 响 
应 时 间 来 度量 。 由 于 数据 库 应 用 环境 、 物 理 存 储 的 变化 ， 特 别 是 用 户 数 和 数据 量 的 不 断 增 加 ， 
数据 库 系统 的 运行 性 能 会 发 生变 化 。 某 些 数据 库 结 构 〈 如 数据 页 和 索引 ) 经 过 一 段 时 间 的 使 用 
以 后 ， 可 能 会 被 破坏 。 所 以 ，DBA 必须 利用 系统 提供 的 性 能 监控 和 分 析 工 具 ， 经 常 对 数据 库 的 
运行 、 存 储 空间 及 响应 时 间 进 行 分 析 ， 结 合用 户 的 反映 确定 改进 措施 。 目 前 的 DBMS 都 提供 一 
些 系统 监控 或 分 析 工具 。 例 如 , 在 SQL Server 中 使 用 SQL Server Profiler 组 件 、Transaction-SQL 
工具 和 Query Analyzer 组 件 等 都 可 进行 系统 监测 和 分 析 。 

(2) 数据 库 的 备份 及 故障 恢复 。 数 据 库 是 企业 的 一 种 资源 ， 所 以 在 数据 库 设 计 阶 段 ，DBA 
应 根据 应 用 要 求 制定 不 同 的 备份 方案 ， 保 证 一 旦 发 生 故 障 能 很 快 将 数据 库 恢 复 到 某 种 一 致 性 状 
态 ， 尽 量 减 少 损失 。 数 据 库 的 备份 及 故障 恢复 方案 ， 一 般 基 于 DBMS 提供 的 恢复 手段 。 

(3) 数据 库 重 组 和 重 构 。 数 据 库 运 行 一 段 时 间 后 ， 由 于 记录 的 增 、 删 、 改 ， 数 据 库 中 物理 
存储 碎片 记录 链 过 多 ， 影 响 了 数据 库 的 存 取 效率 。 这 时 ， 需 要 对 数据 库 进行 重组 和 部 分 重组 。 
数据 库 的 重组 是 指 在 不 改变 数据 库 逻 辑 和 物理 结构 的 情况 下 去 除数 据 库 存储 文件 中 的 废弃 空 
间 以 及 碎片 空间 中 的 指针 链 ， 使 数据 库 记 录 在 物理 上 紧 连 。 数 据 库 的 重 构 是 指 当 数据 库 的 逻辑 
结构 不 能 满足 当前 数据 处 理 的 要 求 时 对 数据 库 的 模式 和 内 模式 修改 。 

注意 : 由 于 数据 库 重 构 的 困难 和 复杂 性 , 数据 库 的 重 构 一 般 都 在 迫不得已 的 情况 下 才 进 行 。 
例如 ， 应 用 需求 发 生 了 变化 ， 需 要 增加 新 的 应 用 或 实体 ， 取 消 某 些 应 用 或 实体 。 又 如 ， 表 的 增 
如 、 表 中 数据 项 的 增 / 删 、 数 据 项 类 型 的 变化 等 。 重 构 数 据 库 后 ， 还 需要 修改 相应 的 应 用 程序 ， 
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并 且 重 构 也 只 能 对 部 分 数据 库 结 构 进行 。 一 旦 应 用 需求 变化 太 大 ， 需 要 对 全 部 数据 库 结 构 进行 
重组 ， 说 明 该 数据 库 系 统 的 生命 周期 已 经 结束 ， 需 要 设计 新 的 数据 库 应 用 系统 。 


12.2.7 ”案例 分 析 


某 单位 图 书馆 需要 建立 一 个 图 书 管理 系统 ， 在 图 书 管理 过 程 中 ， 由 于 要 处 理 多 种 不 同 的 业 
务 流程 ， 各 个 部 门 之 间 有 相互 联系 。 


1.， 图 书 管理 需求 分 析 


通过 对 图 书 管理 日 常 工作 的 详细 调查 , 该 图 书馆 对 某 书目 的 信息 如 表 12-1 所 示 , 与 该 书目 
对 应 的 图 书信 息 如 表 12-2 所 示 。 


表 12-1 书目 信息 


书 名 出 版 年 月 经 办 人 
数据 结构 清华 大 学 由 版 社 


表 12-2 图 书信 息 


图 书画 存放 位 置 | 状 态 | 经 办 人 
C832.1 图 书 流通 室 01 


C832.3 ISBN7-302-02368-9 图 书 流通 室 未 借 出 01 
C832.4 ISBN7-302-02368-9 图 书 流通 室 01 


1) 初步 的 需求 分 析 结 果 

(1) 资料 宝 有 图 书 管理 员 若 干 名 ， 他 们 负责 已 购 入 图 书 的 编目 和 借 还 工作 ， 每 名 图 书 管理 
员 的 信息 包括 工 号 和 姓名 。 

(2) 读者 可 在 阅览 室 读书 ， 也 可 通过 图 书 流 通 室 借 还 图 书 ， 读 者 信息 包括 姓名 、 年 龄 、 工 
作 单 位 、 借 书证 号 、 电 话 和 E-mail， 系统 为 不 同 读者 生成 不 同 的 借 书 证 号 。 

(3) 每 本 书 在 系统 中 对 应 唯一 的 一 条 图 书 在 版 编目 数据 (CIP， 以 下 简称 书目 )， 书 目的 基 
本 信息 包括 ISBN 号 、 书 名 、 作 者 、 出 版 商 、 出 版 年 月 以 及 本 资料 宝 拥有 该 书 的 册 数 (以 下 简 
称 册 数 )， 不 同 书目 的 ISBN 号 不 相同 。 

(4) 资料 室 对 于 同一 书目 的 图 书 可 拥有 多 册 (本)， 图 书信 息 包括 图 书 ID、ISBN 号 、 存 放 
位 置 和 当前 状态 ， 每 一 本 书 在 系统 中 被 赋予 唯 一 的 图 书 人 D。 

(5) 一 名 读者 最 多 只 能 借阅 10 本 图 书 ， 且 每 本 图 书 最 多 只 能 借 两 个 月 ， 读 者 借 书 时 需 由 图 
书 管理 员 登 记 读者 ID、 亡 借 图 书 卫 、 借 阅 时 间 和 应 还 时 间 ， 读 者 还 书 时 图 书 管理 员 在 对 应 的 


C832.2 ISBN7-302-02368-9 图 书 阅览 室 不 外 借 01 


So 
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借 书 信息 中 记录 归还 时 间 。 

(6) 当 某 书目 的 可 借 出 图 书 的 数量 为 0 时 ， 读 者 可 以 对 其 进行 预约 登记 ， 即 记录 读者 ID、 
需要 借阅 的 图 书 的 ISBN 号 和 预约 时 间 。 

2) 业务 流程 

图 书 管理 信息 系统 在 应 用 中 的 业务 流程 图 如 图 12-12 所 示 。 


图 书证 
注册 与 注销 


借 书 证 号 、 
图 书 编号 、 
姓名 等 


读者 借阅 还 书 
数据 库 


沸 书 证 号 


统计 结果 | 


借 书 证 号 、 
图 书 编号 


借阅 情况 
读者 情况 


图 12-12 图书 管理 业务 流程 图 


系统 的 主要 业务 处 理 如 下 。 

(1) 入 库 管 理 。 图 书 购 进入 库 时 ， 管 理 员 查询 本 资料 室 的 书目 信息 ， 若 该 书 的 书目 尚未 建立 ， 
则 由 管理 员 编写 该 书 的 书目 信息 并 输入 系统 , 然后 编写 并 输入 图 书信 息 ; 否则 , 修改 该 书目 的 册 数 ， 
然后 编写 并 输入 图 书信 息 。 对 于 进入 流通 室 的 书 ， 其 初始 状态 为 “未 借 出 ”， 而 送 入 阅览 室 的 书 的 
状态 始终 为 “不 外 借 ”。 

(2) 图 书证 注册 和 注销 。 登 记 所 有 办 理 的 新 图 书证 和 注销 图 书证 ， 需 要 注 明 办 理 及 注销 日 
期 及 管理 员 号 。 

(3) 挂失 管理 。 挂 失 管理 包括 挂失 登记 和 解除 挂失 ,挂失 登记 指 登 记 挂失 的 借 书 证 ， 使 得 该 
图 书证 不 能 借 书 ， 注 明 挂失 日 期 及 管理 员 号 ; 解除 挂失 指 解 除 已 经 挂失 的 借 书 证 ， 使 得 该 借 书 
证 可 以 开始 借 书 ， 注 明 解 除 挂失 日 期 及 管理 员 号 。 

(4) 借 书 管理 。 读 者 借 书 时 ， 若 有 ， 则 由 管理 员 为 该 读者 办 理 借 书 手续 ， 并 记录 该 读者 的 借 
书信 息 ， 同 时 将 借 出 图 书 的 状态 修改 为 “已 借 出 ”。 
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(5) 预约 管理 。 若 图 书 流通 室 没有 读者 要 借 的 书 ， 则 可 为 该 读者 建立 预约 登记 ， 需 要 记录 读 
者 ID、 书 的 ISBN 号 、 预 约 时 间 和 预约 期 限 ( 最 长 为 10 天 )。 一 旦 其 他 读者 归还 这 种 书 ， 就 自 
动 通知 该 预约 读者 。 系 统 将 自动 清除 超出 预约 期 限 的 预约 记录 并 修改 相关 信息 。 

(6) 还 书 管理 。 读 者 还 书 时 ， 则 记录 相应 借 还 信息 中 的 “归还 时 间 ”， 对 于 超期 归还 者 ， 系 
统 自动 计算 罚金 (具体 的 计算 过 程 此 处 省 略 )。 系 统 同时 自动 查询 预约 登记 表 ， 若 存在 其 他 读者 预 
约 该 书 的 记录 ， 则 将 该 图 书 的 状态 修改 为 “已 预约 ” 并 将 该 图 书 ID 写 入 相应 的 预约 记录 中 (系统 
在 清除 超出 预约 期 限 的 记录 时 解除 该 图 书 的 “已 预约 ”状态 )， 否则， 将 该 图 书 的 状态 修改 为 “未 
借 出 ”。 

(7) 通知 处 理 。 对 于 已 到 期 且 未 归还 的 图 书 ， 系 统 通过 E-mail 自动 通知 读者 。 若 读者 预约 的 
书 已 到 ， 系 统 则 自动 通过 E-mail 通知 该 读者 来 办 理 借 书 手续 。 


2.， 图书 管 理 概念 结构 设计 


根据 需求 分 析 的 结果 设计 的 实体 -联系 图 〈 不 完整 ) 如 图 12-13 所 示 ， 请 指出 读者 与 图 书 、 
书目 与 读者 、 书 目 与 图 书 之 间 的 联系 类 型 ， 并 补充 图 12-13 中 实体 间 缺 少 的 联系 。 


图 12-13 图 书 管理 系统 的 实体 -联系 图 


1) 联系 类 型 

读者 与 图 书 、 书 目 与 图 书 、 书 目 与 读者 之 间 的 联系 类 型 分 析 如 下 。 

(1) 读者 与 图 书 之 间 的 联系 类 型 。 读 者 与 图 书 之 间 形 成 了 借 还 关系 ， 需 求 分 析 的 结果 已 经 
说 明 “ 一 名 读者 最 多 只 能 借阅 10 本 图 书 ”” 显然 一 本 图 书 可 被 多 名 读者 借阅 ， 而 每 名 读者 应 该 
能 够 借阅 多 本 图 书 ， 因 此 读者 与 图 书 之 间 的 借 还 联系 为 多 对 多 (n : mm)， 即 空 (1) 和 空 (2) 
应 分 别 填写 nn 和 m。 

(2) 书目 与 图 书 之 间 的 联系 类 型 。 图 书馆 对 于 同一 书目 的 图 书 可 拥有 多 册 (本 )， 每 一 本 
书 在 系统 中 被 赋予 唯一 的 图 书 ID, 所 以 书目 与 图 书 之 间 的 联系 类 型 为 一 对 多 (1 : n), 即 空 (3) 
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和 空 〈4) 应 分 别 填写 1 和 m。 

(3) 书目 与 读者 之 间 的 联系 类 型 。 当 某 书目 的 可 借 出 图 书 的 数量 为 0 时 ， 读 者 可 以 对 其 进 
行 预约 登记 ， 由 于 一 名 读者 可 借阅 多 种 图 书 ， 因 此 书目 与 读者 之 间 的 预约 联系 类 型 为 多 对 多 
(n; m)， 即 空 (5) 和 空 (6) 应 分 别 填写 n 和 mm。 

2) 图 书馆 管理 E-R 模型 

根据 需求 分 析 的 结果 ， 图 书馆 管理 应 该 包括 图 书证 注册 、 注 销 和 挂失 管理 ， 因 此 在 图 12-13 
中 ， 管 理 员 和 读者 实体 间 缺 少 的 联系 有 注册 、 注 销 和 挂失 借 书 证 管理 联系 。 补 充 缺 少 的 联系 的 
E-R 模型 如 图 12-14 所 示 。 


图 12-14 ”补充 缺少 的 联系 的 图 书 管理 系统 的 实体 -联系 图 


3. 图 书 管理 逻辑 结构 设计 


根据 概念 设计 得 到 的 E-R 图 转换 成 图 书 管理 系统 的 主要 关系 模式 如 下 , 请 补充 “ 借 还 记录 ” 
和 “预约 登记 ”关系 中 的 空缺 。 注 : 时 间 格 式 为 “年 .月 .日 时 :分 : 秒 ”， 请 指出 读者 、 书 目 关系 
模式 的 主键 ， 以 及 图 书 、 借 还 记录 和 预约 登记 关系 模式 的 主键 和 外 键 。 


管理 员 〈 工 号 ， 姓 名 ， 权 限 ) 

读者 〈 姓 名 ， 年 龄 ， 工 作 单位 ， 借 书证 号 ， 电 话 ，E-mail) 

书目 (ISBN 号 ， 书 名 ， 作 者 ， 出 版 商 ， 出 版 年 月 ， 册 数 ， 工 号 ) 
图 书 〈 图 书 ID，ISBN 号 ， 存 放 位 置 ， 状 态 ， 工 号 ) 


借 还 记录 ( (a) ， 借 出 时 间 ， 应 还 时 间 ， 归 还 时 间 ) 
预约 登记 ( (b) ， 预 约 时 间 ， 预 约 期 限 ， 图 书 ID ) 
借 书证 管理 〈 借 书证 号 ， 使 用 状态 ， 开 始 时 间 ， 结 束 时 间 ， 工 号 ) 

1) 问题 分 析 


由 于 读者 借 书 时 需 由 图 书 管理 员 登 记 借 书证 号 、 所 借 图 书 ID、 借 出 时 间 和 应 还 时 间 ， 还 书 
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时 图 书 管理 员 在 对 应 的 借 书 信息 中 记录 归还 时 间 ， 因 此 借 还 记录 关系 中 的 空 (a) 处 应 填 入 “ 借 
书证 号 ， 图 书 ID”。 

读者 对 某 书目 进行 预约 登记 时 ， 需 记录 借 书 证 号 、 需 要 借阅 的 图 书 的 ISBN 号 和 预约 时 间 
等 ， 目 前 的 预约 登记 关系 中 已 经 有 预约 时 间 、 预 约 期 限 、 图 书 ID 信息 ， 显 然 还 需要 记录 是 哪 
位 读者 预约 了 书 ， 以 及 书 的 ISBN 号 ， 因 此 ， 预 约 登 记 关系 模式 中 的 空 (b) 处 应 填 入 “ 借 书证 
号 ，ISBN 号 ”。 

2) 主键 与 外 键 分 析 
主键 也 称 为 主 码 ， 是 关系 中 的 一 个 或 一 组 属性 ， 其 值 能 唯一 标识 一 个 元 组 。 根 据 图 书 管理 
的 需求 分 析 如 下 。 

(1) 管理 员 关 系 。 主 键 显然 是 “ 工 号 ” 

(2) 读者 关系 。“ 系 统 为 不 同 读者 生成 不 同 的 借 书 证 号 ”因此 读者 关系 的 主键 显然 是 “ 借 
书证 号 ”。 

(3) 书目 关系 。 不 同 书目 的 ISBN 号 不 相同 ， 书 目 关系 的 主键 为 书 的 “ISBN 号 ”， 外 键 是 
管理 员 关 系 的 “ 工 号 ”。 

(4) 图 书 关系 。 同 一 书目 的 多 册 《〈 本 ) 图书 具有 相同 的 ISBN 号 ， 因 此 所 有 的 图 书 依据 “图 
书 ID” 相 互 区 分 ， 图 书 关系 的 主键 是 “图 书 ID ”， 外 键 是 书目 关系 的 “ISBN 号 ”和 管理 员 关系 的 
《< 王曙光 

(5) 借 还 记录 关系 。 用 于 记录 读者 的 借 书 和 还 书信 息 ， 为 了 区 分 读者 在 同一 日 期 对 同一 本 书 多 
次 借 还 ， 借 还 记录 的 主键 为 “ 借 书 证 号 ， 图 书 ID， 借 出 时 间 ” 借 还 记录 是 由 联系 借 还 对 应 的 关 
系 ， 它 记录 与 图 书 和 读者 的 联系 。 因 此 ， 借 还 记录 具有 外 键 借 书 证 号 和 图 书 ID， 分 别 与 读者 和 
图 书 相关 联 。 

(6) 预约 登记 关系 。 主 键 为 “ 借 书 证 号 ，ISBN 号 ， 预 约 时 间 ” 外 键 为 读者 关系 的 “ 借 书 证 
号 ”书目 关系 的 “ISBN 号 ”和 图 书 关系 的 “图 书 ID ”。 

(7) 借 书证 管理 关系 。 主 键 为 “ 借 书 证 号 ， 开 始 时 间 ”， 外 键 是 管理 员 关 系 的 “ 工 号 ”。 

在 实现 数据 库 迪 辑 结构 设计 之 后 ， 就 要 确定 数据 库 在 计算 机 中 的 具体 存储 。 由 于 数据 库 在 
物理 设备 上 的 存储 结构 与 存 取 方 法 依赖 于 给 定 的 计算 机 系统 和 应 用 环境 ， 故 案例 中 不 再 介绍 。 


12.3 面向 对 象 分 析 与 设计 


面向 对 象 开发 方法 将 问题 和 问题 的 解决 方案 组 织 为 离散 对 象 的 集合 ， 数 据 结 构 和 行为 都 包 
含 在 对 象 的 表示 中 。 面 向 对 象 的 特性 包括 表示 、 抽 象 、 分 类 、 封 装 、 继 承 、 多 态 和 持久 性 。 面 
向 对 象 开发 方法 包括 面向 对 象 分 析 、 面 向 对 象 设计 和 面向 对 象 实现 。 面 向 对 象 分 析 强 调 在 问题 
领域 内 发 现 和 描述 对 象 或 概念 。 例 如 ， 在 图 书馆 信息 系统 里 包含 了 书 、 图 书馆 和 顾客 这 样 一 些 
概念 。 面 向 对 象 设计 是 采用 协作 的 对 象 、 对 象 的 属性 和 方法 说 明 软 件 解决 方案 的 一 种 方式 ， 强 
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调 的 是 定义 软件 对 象 和 这 些 软件 对 象 如 何 协作 来 满足 需求 ， 是 面向 对 象 分 析 的 延续 。 例 如 ， 图 
书馆 系统 中 ， 软 件 对 象 “ 书 ”可 以 有 “标题 ”属性 和 “获取 书 ” 方 法 。 在 面向 对 象 编程 过 程 中 
会 实现 设计 对 象 ， 如 Java 中 的 Book 类 。 

面向 对 和 象 方法 中 分 析 和 设计 有 时 会 存在 一 部 分 重合 , 不 是 完全 独立 的 活动 。 在 迭代 开发 中 ， 
不 严格 区 分 分 析 、 设 计 和 实现 ， 而 是 每 次 迭代 不 同 程度 地 进行 精 化 。 

面向 对 象 分 析 和 设计 目前 采用 最 多 的 是 使 用 UML。 它 是 面向 对 象 的 标准 建 模 语言 ， 通 过 统 
一 的 语义 和 符号 表示 ， 使 各 种 方法 的 建 模 过 程 和 表示 统一 起 来 ， 己 成 为 面向 对 象 建 模 的 工业 标 
准 。UML 通过 事务 、 关 系 和 图 对 现实 世界 进行 建 模 。 


12.3.1 ”面向 对 象 分 析 与 设计 的 步 又 


面向 对 象 分 析 包括 3 个 活动 : 建 模 系 统 功 能 ， 发 现 并 组 织 业务 对 象 ， 组 织 对 象 并 记录 其 关 
系 。 面 向 对 象 设计 的 目的 是 说 明 系 统 的 对 象 和 消息 ， 包 括 精 化 用 例 模 型 以 反映 实现 环境 ， 建 模 
支持 用 例 情景 的 对 象 交 互 、 行 为 和 状态 ， 修 改 对 象 模型 以 反映 实现 环境 。 

面向 对 象 分 析 包 含 以 下 关键 步骤 。 

(1) 建 模 系统 功能 。 需 求 分 析 可 以 包括 对 相关 领域 过 程 的 描述 ,首先 对 系统 需求 进行 建 模 ， 
产生 用 例 图 。 用 例 建 模 促进 并 鼓励 了 用 户 参 与 ， 为 后 期 测试 、 跟 踪 和 维护 等 方面 提供 支持 ， 是 
项 目 成 功 的 一 个 关键 因素 。 建 模 需 求 用 例 模型 的 目的 是 提取 和 分 析 足 够 的 需求 信息 ， 准 备 一 个 
模型 ， 该 模型 表示 用 户 需要 什么 。 产 生 用 例 的 步骤 如 下 。 

Q@ 确定 参与 者 。 

@ 确定 需求 用 例 。 

@ 构造 用 例 模型 。 

@ 记录 需求 用 例 描述 。 

然后 建 模 用 例 活 动 ， 即 建 模 系统 的 过 程 和 步 又， 描述 业 务 过 程 或 用 例 的 活动 的 顺序 流程 和 
并 行 活动 。UML 活动 图 用 于 构建 系统 的 活动 。 建 模 用 例 执行 过 程 中 对 象 如 何 通 过 消息 相互 交互 ， 
将 系统 作为 一 个 整体 或 者 几 个 子 系统 进行 考虑 。 

(2) 定义 领域 模型 。 面 向 对 象 分 析 是 从 按 对 象 分 类 的 角度 来 创建 对 象 领域 的 描述 。 领 域 的 
分 解 包括 定义 概念 、 属 性 和 重要 的 关联 。 其 结果 可 以 被 表示 成 领域 模型 ， 用 一 组 显示 领域 概念 
或 对 象 的 图 形 来 表示 领域 模型 。 

Q 在 用 例 建 模 中 发 现 和 确定 业务 对 象 。 

@ 组 织 对 象 并 记录 对 象 之 间 的 主要 概念 关系 。 类 图 以 图 形 化 的 用 例 描 述 对 象 及 其 关联 关 
系 。 在 该 图 中 还 包括 多 重 性 、 关 联 关系 、 泛 化 / 特 化 关系 以 及 聚合 关系 。 

(3) 定义 交互 、 行 为 和 状态 。 面 向 对 象 设计 定义 软件 对 象 及 其 协作 。 首 先 确定 并 分 类 用 例 
设计 类 ， 然 后 确定 类 属性 、 行 为 和 责任 。 交 互 概览 图 描述 业务 过 程 中 的 控制 流 概览 ， 软 件 过 程 
中 的 详细 罗 辑 概览 ， 以 及 将 多 个 图 进行 连接 。 序 列 图 和 通信 图 可 描述 场景 中 涉及 的 所 有 对 象 类 
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之 间 的 交互 。 序 列 图 通过 描述 按照 时 间 顺 序 对象 之 间 的 消息 交互 建 横 了 用 例 (或 用 例 的 一 部 分 》 
的 逻辑 。 这 些 消息 按照 时 间 顺 序 自 项 向 下 排列 ， 展 示 出 软件 对 象 之 间 的 消息 流动 以 及 因此 而 引 
起 的 方法 调用 ， 描 述 对 象 之 间 的 协作 。 通 信 图 强调 收发 消息 的 对 象 的 结构 组 织 。 还 需 基于 对 象 
的 状态 变化 确定 和 建 模具 有 复杂 行为 的 对 象 ， 建 模 状 态 图 。 

(4) 定义 设计 类 图 。 除 了 在 交互 图 中 表示 对 象 协作 的 动态 视图 外 ， 还 可 以 使 用 设计 类 图 来 
创建 类 定义 的 静态 视图 ， 并 说 明 类 的 属性 和 方法 。 

下 面 通过 一 个 案例 来 说 明 如 何 应 用 面向 对 象 分 析 和 设计 技术 。 


12.3.2 需求 说 明 


某 在 线 会 议 审 稿 系统 (Online Reviewing System，ORS) 主要 处 理会 议 前 期 的 投稿 和 审 稿 
事务 。 会 议 有 名 称 、 涵 盖 的 主题 〈 包 括 名 称 和 描述 )、 提 交 期 限 、 审 稿 期 限 、 通 知 日 期 、 状 态 
和 会 议 召 开 日 期 等 信息 。 创 建 一 个 新 的 会 议 后 审 稿 系 统 启动 ， 在 审 稿 结束 时 关闭 审 稿 过 程 。 

用 户 在 初始 使 用 系统 时 ， 必 须 在 系统 中 注册 成 为 作者 或 审 稿 人 ， 需 要 提供 名 称 、 单 位 、 电 
子 邮件 、 登 录 名 、 密 码 、 登 录 的 状态 。 

作者 登录 后 提交 稿件 和 浏览 稿件 审阅 结果 。 提 交 稿 件 必须 在 规定 提交 时 间 范 围 内 ， 其 过 程 
为 先 输入 标题 和 摘要 、 选 择 稿 件 所 属 主题 类 型 、 选 择 稿 件 所 在 位 置 ( 存 储 位 置 )。 上 述 儿 步 若 
未 完成 ， 则 重复 ， 若 完成 ， 则 上 传 稿件 至 数据 存储 中 ， 系 统 发 送 接收 到 稿件 的 通知 。 稿 件 的 信 
息 包括 稿件 ID、 标题 、 摘 要 、URL、 状 态 和 录用 标准 。 状 态 随 着 整个 审 稿 过 程 的 进行 而 进行 更 新 。 

审 稿 人 登录 后 可 设置 兴趣 领域 、 审 阅 稿件 给 出 评价 意见 以 及 罗列 录用 和 (或 ) 拒绝 的 稿件 。 
审阅 意见 从 原创 性 、 技 术 质 量 、 相 关 性 和 总 体 评价 多 个 方面 进行 输入 。 稿 件 要 限制 不 能 被 作者 
本 人 审阅 。 

会 议 委员 会 主席 是 一 个 特殊 审 稿 人 ， 可 以 浏览 提交 的 稿件 、 到 了 稿件 提交 的 最 终日 期 后 给 
审 稿 人 分 配 稿件 、 罗 列 录用 和 (或 ) 拒绝 的 稿件 以 及 关闭 审 稿 过 程 。 如 果 审 稿 完成 ， 浏 览 提 交 
的 稿件 时 可 以 列 出 录用 和 或) 拒绝 的 稿件 。 分 配 稿件 时 需要 满足 一 篇 稿件 陆续 被 分 配给 3 个 
审 稿 人 审阅 ， 当 审阅 完成 时 ， 如 果 3 位 审 稿 人 的 总 评价 满足 设 定 的 录用 标准 〈 审 稿 人 评价 值 大 
于 等 于 某 个 阐 值 )， 则 稿件 被 录用 ， 否 则 退 稿 ， 并 发 送 电 子 邮 件 通 知 作者 被 录用 或 退 稿 。 如 果 
稿件 被 录用 ， 则 准备 可 打印 版 并 打印 。 关 闭 审 稿 过 程 包括 罗列 录用 和 (或 ) 拒绝 的 稿件 。 


12.3.3” 建 模 用 例 


用 例 图 描述 系统 与 外 部 系统 和 用 户 的 交互 。 换 句 话 说， 它们 以 图 形 化 的 方式 描述 了 谁 将 使 
用 系统 ， 以 及 用 户 期 望 以 什么 方式 与 系统 交互 。 用 例 描述 也 用 于 以 文本 化 的 方式 描述 每 个 交互 
步骤 的 顺序 。 用 例 是 一 个 行为 上 相关 的 步骤 序列 〈 一 个 场景 )， 既 可 以 是 自动 的 也 可 以 是 手工 
的 ， 其 目的 是 完成 一 个 业务 任务 。 用 例 从 外 部 用 户 的 观点 并 以 他 们 可 以 理解 的 方式 和 词汇 描述 
系统 功能 。 参 与 者 代表 了 需要 同系 统 交互 以 交换 信息 的 任何 事物 。 发 起 或 者 触发 用 例 的 外 部 用 
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户 称 为 参与 者 ， 如 人 、 组 织 、 其 他 信息 系统 、 外 部 设备 甚至 是 时 间 。 用 例 之 间 还 可 能 存在 扩展 
关系 、 包 含 关 系 、 依 赖 关系 和 继承 关系 ， 需 要 进行 识别 和 建 模 。 
初步 的 需求 分 析 得 出 表 12-3 所 示 的 参与 者 和 表 12-4 所 示 用 例 。 


表 12-3 参与 者 列表 


名 称 说 了 明 名 称 说 了 明 
User 用 户 Anuthor 作者 
Reviewer 审 稿 人 PCChair 委 


名 称 说 明 
login 登录 系统 
submit paper 提交 稿件 
close reviewing process | 关闭 审 稿 过 程 
set preferences 设 定 兴趣 领域 
list accepted/rejected 罗列 录用 和 (或 ) 拒绝 
papers 的 稿件 


从 需求 说 明 中 可 知 


名 称 
Tegister 
browse Ieview results 
assign paper to reviewer 
enter review 


browse submitted papers 


说 了 明 
注册 
浏览 稿件 审阅 结果 


分 配 稿件 给 审 稿 人 
审阅 稿件 给 出 意见 


浏览 提交 的 稿件 


(1) 用 户 需 注册 成 为 合法 的 作者 和 审 稿 人 ， 因 此 ， 如 果 一 个 用 户 要 登录 时 ， 可 先 注 册 ， 再 


(2) 作者 必须 登录 之 后 才能 提交 稿件 。 


(3) 审 稿 完成 后 ， 浏 览 提交 的 稿件 时 可 以 列 出 录用 和 或) 拒绝 的 稿件 。 
(4) 关闭 审 稿 过 程 包括 罗列 录用 和 (或) 拒绝 的 稿件 ， 可 识别 出 扩展 关系 和 包含 关系 。 


根据 上 述 分 析 ， 建 模 出 用 例 图 如 图 12-15 所 示 的 审 稿 系统 用 例 图 。 


用 例 建 模 技术 用 于 描述 系统 使 用 的 模型 ， 其 建 模 过 程 是 以 用 户 为 中 心 的 建 模 过 程 ， 先 识别 
问题 中 的 参与 者 ， 再 根据 参与 者 确定 每 个 参与 者 的 用 例 、 定 义 用 例 之 间 的 关系 、 确 定 模型 的 过 
程 。 用 例 模型 作为 后 续 面 向 对 象 分 析 和 设计 的 基础 。 


而 增加 用 例 模型 的 复杂 度 。 
12.3.4” 建 模 活动 


注意 : 要 小 心 选 用 用 例 之 间 的 关系 ,一 般 来 说 ， 这 些 关 系 都 会 增加 用 例 和 关系 的 个 数 ， 从 


在 用 例 建 模 完成 后 ， 对 每 个 用 例 进行 细 化 ， 建 模 活动 图 。 活 动 图 描述 一 个 业务 过 程 或 者 一 
个 用 例 的 活动 的 顺序 , 也 可 以 用 于 系统 的 建 模 逻 辑 。 在 此 以 用 例 提交 稿件 (Submit Paper) 为 例 ， 


建 模 其 活动 。 
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(extend) 7 


be 《extend》 


User 
| <= 


a 


Reviewer 


browse submitted 
papers 


---- (include ) 
PC chair 
assign 
paper to reviewer 


图 12-15 审 稿 系 统 用 例 图 
根据 需求 描述 ， 提 交 稿 件 过 程 识别 出 表 12-5 所 示 的 活动 。 
表 12-5 提交 稿件 活动 名 称 列表 


选择 稿件 位 置 
select subject group | 选择 主题 类 型 
enter title and abstract 输入 标题 和 摘要 


select paper location upload paper 


send notification 


从 建 模 用 例 图 时 可 知 ， 参 与 者 、 作 者 和 用 户 之 间 存 在 继承 关系 ,提交 稿 件 和 登录 之 间 存 在 
扩展 关系 ， 提 交 稿件 必须 是 在 登录 之 后 进行 ， 所 以 ， 在 提交 稿件 的 过 程 中 首先 判断 用 户 是 否 登 
录 ， 如 果 登 录 则 继续 ， 如 果 没 有 登录 ， 则 执行 登录 活动 。 根 据 活动 说 明 ， 建 模 出 图 12-16 所 示 
的 活动 图 ， 其 中 <<datastore>> 用 于 说 明 稿件 存储 对 象 。 


eo 
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entertitle Select select 
and abstract subject group paper location 


[not complete] 


send 
notification 


[ok] 
<<datastore>> 
Paper 


upload paper 
new 


图 12-16 ”提交 稿件 过 程 活动 图 

活动 图 并 不 同 于 流程 图 ， 它 提供 了 描述 并 行 活动 的 机 制 ， 特 别 适用 于 建 模 操 作 正 在 执行 时 
的 活动 以 及 那些 活动 的 结果 。 建 模 活 动 图 时 应 该 遵循 以 下 指导 原则 。 

(1) 根据 分 析 决 定 是 否 采 用 泳 道 。 

(2) 从 一 个 作为 起 点 的 初始 结 点 开始 。 

(3) 为 用 例 的 每 个 主要 步骤 〈 或 者 一 个 角色 发 起 的 每 个 主要 步骤 ) 添加 一 个 动作 。 

(4) 从 一 个 动作 到 另 一 个 动作 、 决 策 点 或 者 终点 添加 一 条 流 。 除 分 支 、 合 并 、 分 贫 和 汇合 
外 ， 每 个 动作 应 该 只 有 一 个 输入 流 和 一 个 输出 流 。 

(5) 在 流 分 解 成 不 同 的 路 线 的 地 方 添加 分 支 ， 确 保 用 一 个 合并 将 各 个 流 重 新 合并 。 

(6) 在 并 行 执行 活动 的 地 方 添加 分 又 和 汇合 。 

(7) 用 一 个 活动 终止 符号 结束 。 
12.3.5 ”设计 类 图 


类 图 用 于 描述 系统 的 对 象 结 构 ， 显 示 了 构成 系统 的 对 象 类 及 其 之 问 的 关系 。 根 据 需 求 描述 
识别 出 对 象 类 型 有 会 议 、 用 户 、 会 议 主 题 、 稿 件 和 审阅 意见 。 

(1) 会 议 。 会 议 有 名 称 、 涵 盖 的 主题 〈 包 括 名 称 和 描述 )、 提 交 期 限 、 审 稿 期 限 、 通 知 日 
期 、 状 态 和 会 议 召开 日 期 等 信息 。 创 建 一 个 新 的 会 议 后 审 稿 系统 启动 ， 在 审 稿 结束 时 关闭 审 稿 
过 程 。 所 得 到 会 议 的 属性 有 名 称 、 提 交 期 限 、 审 稿 期 限 、 通 知 日 期 、 状 态 和 会 议 召开 日 期 ; 行 
为 有 创建 会 议和 关闭 审 稿 过 程 。 

(2) 用 户 。 需 要 提供 名 称 、 单 位 、 电 子 邮 件 、 登 录 名 、 密 码 、 登 录 的 状态 。 因 此 ， 得 到 用 
户 的 属性 有 名 称 、 单 位 、 电 子 邮 件 、 登 录 名 、 密 码 、 登 录 的 状态 ; 行为 有 登录 和 注册 。 

(3) 会 议 主 题 。 会 议 涵盖 的 主题 包括 名 称 和 描述 ， 所 以 属性 为 名 称 和 描述 。 

(4) 稿件 。 上 传 稿件 的 过 程 中 需要 输入 标题 和 摘要 、 类 型 、URL、 状 态 以 及 审阅 结果 ， 并 
在 系统 内 有 唯一 标识 ， 所 以 稿件 的 属性 有 稿件 一、 标题 、 摘 要 、URL 和 审阅 结果 ;行为 有 上 
传 、 分 配 和 更 新 状态 。 

(5) 审阅 意见 。 审 稿 人 对 稿件 进行 审阅 时 ， 从 原创 性 、 技 术 质 量 、 相 关 性 和 总 体 评价 多 个 
方面 输入 审阅 意见 。 所 以 ， 审 阅 意见 的 属性 有 原创 性 、 技 术 质 量 、 相 关 性 和 总 体 评价 ; 行为 有 
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输入 审阅 意见 。 
类 及 其 属性 名 称 如 表 12-6 所 示 。 


表 12-6 类 及 其 属性 和 行为 名 称 表 


类 属 性 行 为 
名 称 | 说 了 明 名 称 说 明 名 称 说 明 
name 会 议 名 称 newConference | 创建 会 议 
submissionDate 提交 期 限 closeReviewing | 关闭 审 稿 过 程 
reviewDate 审 稿 期 限 


Conference | 会 议 
notificationDate ”| 通知 日 期 


status 状态 
conferenceDate 召开 日 期 


login 登录 


organization register 注册 
电子 邮件 
User 
登录 的 状态 
和 名 称 
Subject 会 议 主 题 De E 和 
description 
originality 原创 性 enterReview 输入 审阅 意见 
technicalQuality 
Review 
relevance 
overallRating 
upload 上 传 
title 书 assign 分 配 
abstract updateStatus 更 新 状态 
Paper 


url 


status 


审阅 结果 


对 于 类 型 之 间 , 确定 其 对 象 /类 关系 、 多 重度 以 及 角色 名 称 , 例如 会 议和 稿件 之 间 的 关系 是 
聚合 关系 ， 一 个 会 议 有 很 多 稿件 ， 用 户 分 为 普通 用 户 user、author 和 reviewer 三 种 角色 ， 并 对 
其 中 的 约束 条 件 加 以 说 明 ， 某 一 稿件 的 审阅 人 不 可 以 是 本 稿件 的 作者 : reviewerintersection 
(authors)>isEmpty， 得 到 图 12-17 所 示 的 审 稿 系统 的 类 图 。 

如 果 一 个 概念 满足 以 下 几 点 就 应 该 抽象 为 一 个 类 。 
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(1) 几 个 有 趣 的 事物 ， 它 们 可 以 作为 一 个 整体 被 描述 为 这 个 概念 。 

(2) 具有 不 与 任何 其 他 的 类 共享 的 属性 。 

(3) 这 个 概念 的 声明 能 将 这 个 类 及 其 所 从 属 的 某 个 较 大 的 类 相 区 别 。 

(4) 这 个 概念 的 边界 是 不 精确 的 。 

(5) “兄弟”( 如 辅助 类 ， 这 些 辅 助 类 的 联合 是 该 类 的 自然 泛 化 ) 数目 是 少 的 。 


Conference 
name 和 
submissionDatc 
Subject reviewDate 
1.* 1 | notificationDate 
a ti 上 status * | +users 
2 conferenceDate User 
I ,Conf 0 name 
newConterence E 
Fa 1 
closeReviewing() organization 


+authors 


login() 
abstract register( 
和 a 
originality We 上 03 |+reviewers 
technicalQuality /result +assignedPapers 


relevance 

overallRating upload(W) 
assign() 
updateStatus () 


+reviews inv: 


Teviewers.intersection(authors) 一 -isEmpty 


enterReview() 


图 12-17 审 稿 系 统 的 类 图 


12.3.6” 建 模 对 象 状态 


对 象 状态 表示 对 象 在 其 生命 期 中 某 一 点 所 处 的 条 件 , 通过 修改 对 象 属性 的 一 个 或 多 个 值 的 
事件 触发 对 象 状态 变化 。 状 态 图 用 于 建 模 在 生命 周期 中 事件 如 何 改 变 对 象 可 以 经 历 的 各 种 状 
态 ， 以 及 引起 对 象 从 一 个 状态 向 另 一 个 状态 转换 的 事件 。 

基于 需求 描述 中 的 信息 ， 稿 件 上 传 成 功 之 后 ， 成 为 已 上 传 状态 。 上 传 稿件 的 最 后 期 限 到 了 
之 后 ， 就 进入 分 配 中 ， 当 分 配给 审 稿 人 的 数量 达到 规定 的 3 个 之 后 ,进入 审阅 中 , 审阅 结束 后 ， 
评估 结果 如 果 大 于 等 于 设 定 的 阔 值 ， 则 变 为 录用 状态 ， 然 后 发 送 E-mail 之 后 ， 变 为 已 通知 ， 当 
提交 完 准备 好 印 制 的 电子 版 时 ， 进 入 打印 中 ， 出 版 之 后 ， 状 态 结束 ;如果 评 估 结 果 小 于 设 定 的 
阔 值 ， 变 为 拒绝 状态 ， 发 送 给 作者 E-mail 通知 状态 结束 。 根 据 分 析 ， 确 定 表 12-7 所 示 状 态 名 
称 以 及 行为 或 事件 涉及 术语 对 照 表 ， 建 模 得 到 图 12-18 所 示 的 一 份 稿件 的 状态 图 。 
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表 12-7 状态 以 及 行为 或 事件 名 称 表 


状 态 行为 或 事件 

名 称 说 明 术 语 说 明 
submitted 已 上 传 date=deadline 日 期 到 最 后 期 限 
under assignment 分 配 中 eviewers 审阅 人 数 
Under review 审阅 中 evaluated 审 稿 结果 
accepted 录用 threshold 阅 值 
rejected 拒绝 camera-ready submitted “| 提交 了 印 制 的 电子 版 
notified 已 通知 published 已 印 制 
inPrint 打印 中 send E-mail 发 送 E-mail 


assign reviewer 
[#reviewers<3] 


under 
assignment 


When(date=deadline) 


send E-mail 


camecra-rcady 
submitted 


published 


evaluated 
[evaluation>= threshold] 


under 
Teview 


[freviewers=3] 
evaluated 
[evaluation < threshold] 


submitted 


send E-mail 


图 12-18 一 份 稿件 的 状态 图 


在 建 模 状态 图 时 应 该 注意 遵循 以 下 指导 原则 。 

(1) 状态 名 称 要 简单 但 具有 描述 性 。 

(2) 避免 “黑洞 ”状态 ， 即 只 有 变换 进来 而 没有 任何 转换 发 出 的 状态 ， 这 种 状态 要 么 由 于 
该 状态 是 一 个 最 终 状 态 ， 要 么 就 是 已 经 错过 了 一 个 或 多 个 转换 。 

(3) 避免 “奇迹 ”状态 ， 即 只 有 转换 发 出 而 没有 任何 转换 进来 的 状态 ， 这 种 状态 要 么 是 一 
个 起 点 ， 要 么 就 是 已 经 错过 了 一 个 或 多 个 转换 。 

(4) 对 复合 状态 ， 需 要 对 子 状态 集 进 行 建 模 。 

(5) 为 复杂 的 实体 创建 分 层 的 状态 图 。 


12.3.7” 建 模 交 互 


交互 概览 图 是 活动 图 的 变 体 , 描述 业务 过 程 中 的 控制 流 概览 , 软件 过 程 中 的 详细 逻辑 概览 ， 


es 
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以 及 将 多 个 图 进行 连接 , 抽象 掉 了 消息 和 生命 线 。 审 稿 系统 中 显示 一 篇 已 分 配 的 稿件 (Displaying 
as assigned paper)， 首 先 需 获取 (Retrieve list of assigned papers)， 然 后 再 显示 ， 然 后 再 显示 
(Display selected paper)， 如 图 12-19 所 示 。 


sd Displaying an assigned paper 


sd Retrieve list of assigned papers | 


sd Display selected paper ] | 


@ 


图 12-19 显示 一 篇 已 分 配 的 稿件 交互 概览 图 


序列 图 是 以 图 形 化 的 方式 描述 了 在 一 个 用 例 或 操作 的 执行 过 程 中 对 象 如 何 通 过 
交互 ， 说 明了 消息 在 对 象 之 间 被 发 送 和 接收 以 及 发 送 的 顺序 。 根 据 分 析 设 计 的 迭代 演化 需 
最 初 可 以 绘制 系统 序列 图 。 系 统 序列 图 是 一 幅 描述 角色 和 系统 在 用 例 场 景 下 交互 的 图 形 ， 有 助 
于 确定 进入 和 退出 系统 的 高 层 信息 。 

审 稿 人 获取 已 分 配给 自己 的 稿件 的 执行 序列 ， 浏 览 会 议 主页 ， 看 到 主页 后 ， 从 导航 条 浏览 
己 分 配给 自己 的 稿件 ， 可 循环 进行 选择 ， 创 建 已 分 配 稿件 并 显示 给 审 稿 人 。 涉 及 到 的 对 象 名 称 
和 执行 操作 如 表 12-8 所 示 ， 得 出 图 12-20 所 示 的 审 稿 人 获取 分 配给 自己 的 稿件 列表 序列 图 。 


表 12-8 ”对 象 和 执行 操作 名 称 列表 


操 


象 作 
加 若 | 说 明 名 称 | 说 明 
Reviewer | 审阅 人 navigate | 导航 
ConferenceHomepage | 会 议 主页 show | 显示 
NavigationBar | browse | 浏览 
AssignedPapers | select | 选择 
Paper create 创建 


ListOfAssignedPapers 


分 的 稿 人 列表 | | 
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sd Retrieve list of assigned papers 


px nferenceH 
Reviewer 


navigate 


:ListOf 


:NavigationBar AssignedPapers 


navigate(assignedPapers) 


show 


图 12-20 审 稿 人 获取 分 配 的 稿件 列表 


建 模 序列 图 应 该 遵循 以 下 指导 原则 。 

(1) 确定 序列 图 的 范围 ， 描 述 这 个 用 例 场景 或 一 个 步骤 。 

(2) 如 果 范 围 包 括 参 与 者 和 接口 ， 则 绘制 参与 者 和 接口 类 。 

(3) 沿 左 手边 列 出 用 例 步 又 。 

(4) 对 控制 器 类 及 必须 在 序列 中 协作 的 每 个 实体 类 ， 基 于 它 拥 有 的 属性 或 已 经 分 配给 它 的 
行为 绘制 框 。 

(5) 为 持久 类 和 系统 类 绘制 框 。 

(6) 绘制 所 需 消 息 ， 并 把 每 条 消息 指 到 将 实现 响应 消息 的 责任 的 类 上 。 

(7) 添加 活动 条 指示 每 个 对 象 实例 的 生命 期 。 

(8) 为 清晰 起 见 ， 添 加 所 需 的 返回 消息 。 

(9) 如 果 需 要 ， 为 循环 、 可 选 步骤 和 替代 步骤 等 添加 框架 。 


12.4 ”算法 分 析 与 设计 


算法 的 概念 在 计算 机 科学 领域 几乎 无 处 不 在 ， 在 各 种 计算 机 软件 系统 的 实现 中 ， 算 法 设计 
往往 处 于 核心 地 位 。 例 如 ， 操 作 系统 是 现代 计算 机 系统 中 不 可 缺少 的 系统 软件 ， 其 中 的 各 个 任 
务 都 是 一 个 单独 的 问题 ， 每 个 问题 由 一 个 子 程序 根据 特定 的 算法 来 实现 。 

尽管 对 有 些 应 用 来 说 ， 在 应 用 这 一 层面 上 没有 什么 特别 明显 的 算法 方面 的 要 求 ， 例 如 ， 一 
些 简单 的 Web 应 用 。 但 是 大 多 数 问题 对 算法 还 是 有 一 定 要 求 的 ， 例 如 ， 假 设 有 一 种 基于 Web 
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的 服务 ， 用 于 确定 如 何 从 一 个 地 方 旅行 到 另 一 个 地 方 ， 这 可 能 涉及 多 个 问题 。 解 决 这 些 问题 依 
赖 于 快速 的 计算 机 硬件 、 图 形 用 户 界 面 (GUD、 广 域 网 技术 ， 甚 至 还 可 能 要 依赖 于 面向 对 象 技 
术 。 除 此 之 外 ， 它 还 需要 某 些 操作 设计 算法 ， 例 如 寻找 路 由 《最 短路 径 算法 )、 显 示 地 图 和 插 
入 地 址 等 。 

此 外 ， 即 使 那些 在 应 用 层面 上 对 算法 性 内 容 没有 什么 要 求 的 应 用 ， 其 实 也 是 相当 依赖 于 算 
法 的 ， 该 应 用 是 否 要 依赖 于 快速 的 计算 机 硬件 ? 硬件 的 设计 就 要 用 到 算法 。 该 应 用 是 否 要 用 到 
图 形 用 户 界面 ? GUI 的 设计 也 要 依赖 于 算法 。 该 应 用 是 否 要 依赖 于 网 络 技术 ? 网 络 路 由 对 算法 
也 有 很 大 的 依赖 。 该 应 用 是 否 采用 某 种 非 机 器 代码 的 语言 编写 ? 那么 ， 它 就 要 由 编译 器 、 解 释 
器 或 汇编 器 来 处 理 ， 所 有 这 些 软件 都 要 大 量 用 到 各 种 算法 。 因 此 ， 每 个 软件 系统 都 会 直接 或 者 
间接 地 涉及 算法 理论 ， 算 法 是 当代 计算 机 中 用 到 的 大 部 分 技术 的 核心 。 

随 着 计算 机 性 能 的 不 断 增 长 ， 有 人 可 能 认为 ， 算 法 的 研究 已 经 不 是 那么 重要 了 。 但 是 想 一 
想 ， 计 算 机 可 以 做 得 很 快 ， 但 还 不 能 无 限 快 。 存 储 器 可 以 做 得 很 便宜 ， 但 不 会 是 免费 的 。 因 此 ， 
计算 时 间 是 一 种 有 限 的 资源 ， 存 储 空间 也 是 一 种 有 限 的 资源 ， 在 开发 软件 系统 时 ， 这 些 有 限 的 
资源 应 该 得 到 有 效 的 利用 。 而 且 ， 正 是 由 于 计算 机 性 能 的 不 断 增长 ， 可 以 利用 计算 机 来 解决 更 
复杂 的 问题 或 者 规模 更 大 的 问题 。 因 此 ， 算 法 的 研究 是 必要 的 ， 它 是 推动 计算 机 技术 发 展 的 
关键 。 

另外 , 算法 只 有 经 过 某 种 程序 设计 语言 实现 , 才能 在 计算 机 上 运行 , 才能 真正 地 解决 问题 ， 
因此 ， 本 节 的 内 容 包 括 两 个 部 分 : C 程序 设计 语言 与 实现 和 算法 设计 与 实现 。 


12.4.1 C 程序 设计 语言 与 实现 


C 语言 是 面向 过 程 程序 设计 中 的 典型 语言 ， 它 提供 了 丰富 的 数据 类 型 、 运 算 符号 和 灵活 的 
控制 语句 ， 热 悉 C 语言 提供 的 数据 类 型 、 运 算 符 号 和 语句 是 进行 C 程序 设计 的 最 基本 要 求 。 合 
理 使 用 数据 类 型 和 控制 结构 对 软件 的 可 维护 性 、 可 扩展 性 有 重要 作用 。 由 于 篇 幅 限 制 ， 本 节 不 
介绍 C 语言 的 基本 语法 ， 只 介绍 C 语言 中 的 一 个 核心 概念 ， 即 指针 。 

指针 是 C 语言 的 精华 部 分 ， 它 极 大 地 丰富 了 C 语言 的 功能 。 通 过 利用 指针 ， 可 以 描述 复杂 
的 数据 结构 ， 在 编程 时 能 很 好 地 利用 内 存 资源 ， 使 其 发 挥 最 大 的 效率 。 运 用 指针 编程 是 C 语言 
最 主要 的 风格 之 一 。 


1. 指针 类 型 


1) 变量 和 指针 
在 程序 中 定义 或 说 明 的 变量 ， 编 译 系统 为 其 分 配 相 应 的 内 存单 元 ， 也 就 是 说 ， 每 个 变量 都 
有 具体 的 地 址 。 简 单 而 言 ， 程 序 语言 中 的 变量 就 是 内 存单 元 的 抽象 。 变 量具 有 类 型 、 值 、 地 址 、 


第 12 章 “软件 系统 分 析 与 设计 “图 647 苦 


作用 域 和 生存 期 等 属性 。 

变量 的 本 质 是 程序 中 用 来 存放 数据 的 一 段 存储 空间 。 一 般 情况 下 ， 变 量 所 对 应 的 存储 空间 
在 内 存 区 域 , C 语言 中 程序 员 可 以 通过 关键 字 register 声明 变量 的 存储 单元 是 CPU 中 的 寄存 器 。 
变量 的 数据 类 型 不 同 ， 它 所 占 的 内 存单 元 数 也 不 相同 。 在 访问 变量 时 ， 首 先 应 找到 其 在 内 
存 的 地 址 。 如 果 在 程序 中 将 变量 的 地 址 保存 在 另 一 个 变量 中 ， 则 形成 指针 变量 ， 通 过 指针 对 所 
指向 变量 的 访问 是 一 种 对 变量 的 “间接 访问 ”。 

例如 ， 下 面 定 义 两 个 变量 ， 整 型 变量 a 和 指针 变量 ptr， 在 存 取 变 量 a 中 的 数据 时 ， 可 通 
过 变量 a 或 指向 变量 a 的 指针 来 进行 ， 分 别称 为 直接 访问 和 间接 访问 。 


int a; /*a 是 整 型 变量 ， 其 值 为 整数 */ 

int *ptr; /*ptr 是 指针 变量 ， 其 值 为 一 个 整 型 变量 的 地 址 */ 
(1) 直接 访问 变量 a 中 的 数据 。 

= 信 将 字面 量 5 赋值 给 变量 a*/ 

a+10; 人 # 读 取 变 量 a 的 值 并 与 字面 量 10 相 加 */ 


(2) 间接 访问 变量 a 中 的 数据 。 


ptr = &a; 让 将 变量 a 的 地 址 赋值 给 指针 变量 ptr， 称 ptr 指向 变量 ar/ 
*ptr = 5; 尺 指 针 变 量 ptr 指向 的 对 象 用 sptr 表示 */ 
/#* 等 价 于 a= 5:， 通 过 指针 变量 ptr 访问 变量 ar/ 


经 上 述 定义 和 处 理 后 ， 变 量 a 和 指针 变量 ptr 之 间 的 关系 如 图 12-21 所 示 。 


ptr a 
&a 十 一 -| 5 
*ptr 


图 12-21 指针 变量 ptr 与 指针 变量 指向 的 对 象 *ptr(a) 
若 指针 变量 指向 的 对 象 仍然 是 一 个 指针 变量 ， 则 称 为 多 级 指针 。 
例如 ， 对 于 下 面 的 变量 定义 ，mulptr 是 指向 指针 变量 ptr 的 变量 ， 这 些 变 量 间 的 关系 如 图 
12-22 所 示 。 
int a, *ptr = &a, **mulptr = &ptr: 


根据 应 用 的 需要 ， 可 以 采用 三 级 或 多 级 指针 。 当 然 ， 采 用 多 级 指针 在 带 来 灵活 性 的 同时 降 
低 了 对 数据 的 访问 效率 。 
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mulptr ptr a 
Rptr | Ra | 5 
*mulptr *ptr 
*#* mulptr 


图 12-22 二 级 指针 变量 mulptr 


2) 通过 指针 访问 数组 中 的 元 素 

C 程序 中 常 利用 指针 对 数组 和 字符 串 进行 处 理 。 一 个 数组 由 连续 的 一 块 内 存单 元 组 成 ， 数 
组 名 就 是 这 块 连续 内 存单 元 的 首 地 址 (起 始 地 址 )。 一 个 数组 是 由 各 个 数组 元 素 ( 通 过 下 标 区 
分 ) 组 成 的 ， 每 个 数组 元 素 按 其 类 型 不 同 占有 若干 个 连续 的 内 存单 元 。 

通过 指针 访问 数组 元 素 是 指针 变量 的 一 种 常见 的 应 用 方式 。 

(1) 指针 变量 与 一 维 数组 。 指 针 变量 指向 一 维 数组 元 素 的 情形 较为 简单 。C 语言 中 定义 一 
个 指向 数组 元 素 的 指针 变量 的 方法 如 下 。 例 如 ,定义 一 个 整 型 数组 st 和 指向 数组 元 素 的 指针 ptr。 


int st[10]; # 定 义 st 为 包含 10 个 整 型 数据 的 数组 */ 
int *ptr=&st[0]; 人 * 定 义 ptr 为 指向 整 型 变量 st[0] 的 指针 ， 等 价 于 int *ptr = st*/ 


若 ptr 指向 数组 的 第 一 个 元 素 ( 即 下 标 为 0 的 元 素 )， 则 *(p+i) 指 向 数组 的 第 计 1 个 元 素 ( 即 
下 标 为 i 的 元 素 )。 

例如 ， 设 数组 a 的 空间 足够 大 ， 函 数 InsertElem(int a[]，int n，int newElem) 的 功能 是 将 
newElem 中 的 数值 插入 到 元 素 已 经 按照 非 递减 方式 排序 的 数组 a 中 ， 并 保持 数组 a 中 数据 的 排 
序 特 性 。 其 中 ， 对 数组 元 素 的 访问 采用 指针 方式 。 


void InsertElem(int a[], int n, int newElem) 


{ 
int *p, *end; 
end= a; 
for(p = &a[n-1];p >= end &&*p>newElem :; --p) 
*(p+1)=*p; 
*(p+1) = newElem:; 
} 


(2) 指针 变量 与 二 维 数组 。 指 针 变 量 指向 二 维 数组 元 素 的 情形 比较 复杂 ， 下 面 举例 简单 
说 明 。 
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设 有 定义 int af3][4]， 其 元 素 布局 如 图 12-23 所 示 。 


列 (第 二 维 ) 
0 1 和 3 
行 0 [10 [20 [30 40 
(第 一 维 ) 1 50 60 40 a[1][2] 
i 90 | 100 | Uo | 120 
下 第 二 维 ) 


0 1 2 3 
EE 


| 0 | 60 [so | 01D] 
1 5 -| 80 al 
(第 维 ) 2 [EW | 


图 12-23 二 维 6570 组 a[3][4] 元 素 布局 


数组 a[3][4] 可 看 作 是 由 3 个 一 维 数组 (a[0]、a[1]、a[2]) 构成 的 一 维 数组 ， 每 个 一 维 数组 
的 元 素 是 4 个 。a 是 二 维 数组 名 ， 它 代表 整个 二 维 数组 的 首 地 址 。 

a[0] 是 第 0 个 一 维 数组 的 数组 名 和 首 地 址 。*(a+0)、*a 和 af[0] 是 等 效 的 ， 它 们 都 表示 一 维 
数组 a[0] 的 0 号 元 素 的 首 地 址 。&a[0][0] 表 示 a 的 第 0 行 第 0 列 元 素 的 首 地 址 。 因 此 ，a、af[0]、 
*(a+0)、*a 和 &a[0][0] 所 表示 的 内 容 相同 。 

同 理 ，a[1] 是 第 1 个 一 维 数组 的 数组 名 和 首 地 址 。 将 二 维 数组 a[3][4] 看 作 元 素 是 一 维 数组 
的 一 维 数组 时 ，a 是 数组 首 地 址 ，a+1l 则 是 1 号 元 素 的 地 址 ， 也 就 是 a[1] 的 地 址 ， 因 此 ，at+1、 
a[1]、*(a+1) 和 &a[1][0] 的 含义 相同 ， 它 们 都 表示 数组 a 第 1 行 中 第 0 个 元 素 的 地 址 。 

所 以 ， 对 于 二 维 数组 aLMI[N]，ati、a[ 宁 、*(ati) 和 &a[i][0] 是 等 同 的 。 

把 三 维 数 组 a[3][4] 分 解 为 一 维 数组 a[0]、a[1]、 a[l2] 之 后 , 设 p 为 指向 二 维 数组 的 指针 变量 。 
可 定义 为 : 

int (sp)[4]: /*p 是 一 个 指针 变量 ， 它 指向 包含 4 个 元 素 的 一 维 数组 */ 


因此 ， 可 令 p=a( 等 价 于 p=&a[0]) 或 p=&a[l1] 或 p=&a[2]。 若 令 p=&a[0]， 则 *(*(p+1)+2) 
就 表示 数组 元 素 a[1][2]， 二 维 数组 其 他 元 素 通过 指针 的 表示 方式 依 此 类 推 。 

3) 指针 与 函数 

C 程序 中 将 指针 与 函数 结合 使 用 的 常见 方式 有 函数 参数 为 指针 、 函 数 返 回 值 为 指针 以 及 通 
过 函数 指针 变量 调用 函数 〈 函 数 指针 变量 )。 

(1) 函数 参数 为 指针 。 函 数 的 参数 不 仅 可 以 是 整 型 、 实 型 、 字 符 型 等 基本 数据 类 型 ， 还 可 
以 是 指针 类 型 。 参 数 使 用 指针 类 型 的 作用 是 将 一 个 变量 的 地 址 传送 到 另 一 个 函数 中 。 

C 语言 中 实 参 向 形 参 传递 值 ， 反 之 则 不 行 。 

例如 ， 定 义 函 数 swap_1(a,b) 的 功能 是 交换 a 和 45 的 值 ， 代 码 如 下 : 


oo 
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void swap_l(int a, intb) ” /* 交 换 a 和 bb 的 值 */ 
* 

int temp; 

temp=a; a=b; b= temp; 
} 


如 果 发 生 函 数 调用 swap_1(x,y)， 则 系统 将 x 的 值 传 给 a、y 的 值 传 给 5， 在 函数 swap_1 中 
实现 了 a 和 4。 的 值 交换 ， 但 是 x 和 y 的 值 并 不 发 生 交换 。 为 实现 将 函数 中 对 形 参 的 修改 结果 返 
回 给 调用 函数 之 处 ， 可 使 用 指针 参数 。 

对 于 上 例 ， 定 义 函 数 swap_2 如 下 : 

void swap_2(int *a, int *b) ” /* 交 换 a 和 b 所 指向 的 变量 的 值 */ 

{ 

int temp; 
temp =*a; *a=*b; *b=temp; 

} 

当 形 式 参数 为 指针 类 型 时 ， 传 递 给 形 参 的 应 该 是 地 址 信息 ， 因 此 调用 swap_2 的 形式 为 
swap_2(&x, &y)。 这 样 通过 “间接 访问 ”， 实 现 了 在 被 调用 函数 中 修改 实 参 所 对 应 的 变量 。 

通过 指针 参数 也 可 以 实现 将 被 调用 函数 中 的 多 个 处 理 结果 传 回 给 调用 函数 的 地 方 。 

当 函 数 的 参数 为 数组 时 ， 实 参 和 形 参 既 可 以 用 指针 形式 ， 也 可 以 用 数组 形式 ， 实 参 向 形 参 
传递 的 是 数组 空间 的 首 地 址 。 

(2) 函数 返回 值 为 指针 。 函 数 类 型 是 指 函数 返回 值 的 类 型 。 在 C 语言 中 允许 一 个 函数 的 返 
回 值 是 一 个 指针 〈 即 地 址 )， 这 种 返回 指针 值 的 函数 称 为 指针 型 函数 。 

需要 注意 的 是 ， 不 能 返回 局 部 数据 的 指针 。 

例如 ， 下 面 的 函数 get_str 虽然 返回 了 局 部 数组 str 的 首 地 址 ， 但 调用 get_str 的 其 他 函数 并 
不 能 通过 此 地 址 访问 字符 串 "testing local pointer"。 

char* get_str(void) { 
char str[] = {"testing local pointer"}:; 
return str; 

} 

int mainO{ 

char *p; 


int i; 
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p= get_str(; 

for(i=0; *(p+ti); it+) 
putchar(*(pti)); 

Teturn 0; 


} 


将 上 述 函 数 get_str 中 的 char str[] = {f"testing local pointer"}; 改 为 char *str ={"testing local 
pointer"} 即 可 ， 或 者 从 内 存 的 堆 区 申请 字符 串 的 空间 ， 然 后 返回 首 地 址 。 


char* get_str(void) { 
char *str; 
str = (char *)malloc(100); 人 # 数 值 100 可 根据 需要 改 为 其 他 值 g/ 
if (!str) 
return NULL; 
strcpy(str "testing local pointer"); 
eturn str; 


} 


函数 返回 值 为 指针 时 ， 也 可 以 实现 将 被 调用 函数 中 的 多 个 处 理 结果 传 回 给 调用 函数 的 
地 方 。 

(3) 指针 变量 。 程 序 中 的 一 个 函数 总 是 占用 一 段 连续 的 内 存 区 ， 而 函数 名 就 是 该 函数 所 占 
内 存 区 的 首 地 址 。 可 以 把 函数 的 首 地 址 (或 称 入 口 地 址 〉 赋 给 一 个 指针 变量 ， 使 指针 变量 指向 
该 函数 ， 然 后 通过 指针 变量 就 可 以 找到 并 调用 这 个 函数 。 指 向 函数 的 指针 变量 称 为 “函数 指针 
变量 ”。 

函数 指针 变量 定义 的 一 般 形 式 为 : 

类 型 说 明 符 (* 指 针 变 量 名 )0; 


其 中 ,“ 类 型 说 明 符 ”表示 被 指 函 数 的 返回 值 的 类 型 ;“(* 指 针 变 量 名 )” 表 示 “* ”后 面 的 变量 
是 指针 变量 ， 最 后 的 一 对 空 括号 表示 指针 变量 所 指向 的 对 象 是 一 个 函数 。 

例如 ， 下 面 定义 了 一 个 函数 指针 变量 funptr。 

int (*funptr)0; 。 ”人 * 指 针 变 量 funptr 指向 的 对 象 是 一 个 返回 值 为 整数 的 函数 */ 


下 面 的 程序 中 先 定义 了 一 个 函数 max(a,b)， 其 功能 是 比较 用 a 和 4 表示 的 两 个 整数 并 返回 
它们 中 的 较 大 者 ， 然 后 通过 函数 指针 变量 调用 max。 
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#include <stdio.h> 

int max(int a,int b){ 
1f (a>b) return a; 
else return b; 


} 


int mainO{ 


; 


int max(int a,int b); /# 声 明 max 是 具有 两 个 整 型 参数 、 返 回 值 为 整数 的 函数 */ 
int(*funptr)O; 


int x,y,Z; 


funptr = max; /* 令 funptr 指向 函数 max*/ 
Printf("input two numbers:\n"); 
scanf("%d%d",&x,&y): 

z=(*funptr)(x,y); /* 等 价 于 z=max(x,y)*/ 
Printf("maxmum=%d",z):; 

retum 0; 


既然 函数 指针 变量 是 一 个 变量 ， 当 然 也 可 以 作为 某 个 函数 的 参数 来 使 用 。 例 如 ， 下 面 的 程 
序 中 设计 了 一 个 testFunCall 函数 , 该 函数 根据 其 函数 指针 参数 值 的 不 同 分 别 调用 函数 funl 和 函 
数 fhtn2 ( 注 : fanl 和 fun2 的 定义 形式 应 相同 )。 


int fanl(int x); 
int fun2(int x); 
typedef int (*FunType)(int): 人 # 定 义 一 个 函数 指针 类 型 FunType*/ 


void testFunCall(FunType 印 ,int x); 


int mainO{ 
testFunCall(fun1,10); /#* 通 过 testFunCall 调用 函数 fun1*/ 
testFunCall(fun2,20):; /#* 通 过 testFunCall 调用 函数 fun2*/ 


Teturn 0; 


} 


void testFunCall (FunType fp,int x){ 


intt: 
t= 印 C9; 人 # 通 过 函数 指针 印 调用 匈 指向 的 函数 专 
Pprintf("result: %d\n", t): 
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int funl(int x) { 
intt; 
t=x*x; 
printf" 函 数 funl 的 参数 为 : %d\t 返回 值 为 : 9odmex.0: 
Teturn t; 
} 
int fun2(int x) { 
int t; 
t= (int)sqrt(x); 
printf" 函 数 fun2 的 参数 为 : %d\t 返回 值 为 : %d\n"x,t); 
Teturn t; 


} 
2. 指针 与 数据 结构 


“程序 = 数据 结构 + 算法 ”常用 来 说 明 程 序 、 数 据 结构 〈 数 据 的 存储 结构 ) 与 算法 之 间 的 关 
系 ， 指 针 在 数据 结构 的 设计 和 实现 中 有 重要 的 作用 。 随 着 软件 开发 环境 的 不 断 完善 和 程序 语言 
的 抽象 程度 不 断 提高 ， 数 据 结构 的 内 部 设计 细节 被 封装 和 屏蔽 起 来 ， 在 很 多 应 用 软件 的 开发 中 
没有 必要 也 不 再 涉及 底层 细节 ， 但 是 在 系统 级 程序 设计 或 嵌入 式 应 用 的 软件 设计 中 ， 指 针 及 相 
关机 制 的 应 用 仍然 是 十 分 必要 的 。 

1) 单 链表 的 实现 和 应 用 

在 数据 结构 的 设计 中 ， 指 针 是 常用 的 工具 。 对 于 无 法 预先 确定 数据 规模 的 应 用 ， 可 采用 动 
态 存储 的 方法 解决 数据 的 存储 问题 ， 也 就 是 链表 结构 。 链 表 中 的 每 个 结 点 之 间 可 以 是 地 址 不 连 
续 的 《 结 点 内 是 连续 的 )， 结 点 之 间 的 联系 用 指针 实现 ， 实 际 上 是 在 结 点 结构 中 定义 一 个 成 员 
项 来 存放 下 一 结 点 的 首 地 址 ， 称 为 指针 域 。 

C 语言 标准 库 中 提供 的 用 于 申请 动态 存储 空间 的 函数 是 mallocO、calloc0 和 realloc0， 函 数 
free0 用 于 释放 由 上 述 函 数 申请 的 内 存 空 间 。 

栈 是 一 种 常用 的 数据 结构 ， 下 面 设计 并 实现 一 个 链表 结构 的 栈 ， 如 图 12-24 所 示 ( 为 了 简 
化 ， 栈 中 的 元 素 类 型 设 为 int 型 )。 


数据 0 数据 1 | 数据 2 数据 3 
NULL 下 一 数据 下 一 数据 下 一 数据 
地 址 地 址 地 址 


栈 底 栈 顶 


12-24 ” 栈 的 链 式 存储 结构 示意 图 
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typedef struct Node { 
int data; 
struct Node* next: 
}Node; 
typedef struct Stack { 
Node * pTop: 
}Stack:; 
Stack* NewStack(O{ 
Teturn (Stack*)calloc(1,sizeof(Stack)); 
} 
int IsEmpty(Stack* S) 
{ 
if(S == NULL ||$->pTop — NULL) retum 1:; 
return 0; 
} 
int Top(Stack* S) 
{ 
if( IsEmpty(S) ) 
retum INT_MIN:; 
return S->pTop->data; 
} 
void Push(Stack* S, int theData) 
b 
Node* newNodePtr: 
newNodePtr = (Node *)malloc(sizeof(Node)):; 
newNodePtr->data = theData; 
newNodePtr->next = S->pTop; 
S->pTop = newNodePtr: 
} 
void Pop(Stack* S) 


a lastTop; 

if( IsEmpty(S) ) retum; 
lastTop = S$->pTop; 
S->pTop = S->pTop->next; 
free(lastTop); 

} 

#define MD(a) a<<2 


话 栈 中 的 数据 元 素 */ 
旋 上 次 入 栈 的 数据 元 素 结 点 的 地 址 */ 


/# 栈 的 类 型 定义 类 
/# 栈 项 指针 如 


上 # 判 断 栈 是 否 为 室 栈 ， 为 空 时 返回 1， 否 则 返回 0*/ 


获取 栈 项 数据 */ 


旋 若 栈 为 空 ， 则 返回 机 器 可 表示 的 最 小 整数 */ 


/* 将 数据 元 素 theData 压 栈 */ 


* 非 空 栈 的 栈 项 元 素 出 栈 */ 
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int mainO{ 
int i; 
Stack* myStack; 
myStack = NewStack():; 
Push(myStack, MD(1)); 
Push(myStack, MD(2)); 
Pop(myStack); 
Push(myStack, MD(3)+1); 
while( !IsEmpty(myStack) ) { 
Printf("%d ", Top(myStack)); 
Pop(myStack); 
} 
return 0; 


} 

2) 二 又 链表 和 多 又 链表 的 设计 和 应 用 

(1) 二 又 树 的 存储 结构 设计 。 二 又 树 是 一 种 重要 的 数据 结构 ， 采 用 二 又 链表 存储 时 ， 其 结 
点 的 类 型 常 定义 为 : 


typedef struct Tnode{ 
ElemType data; /# 结 点 的 数据 ，ElemType 是 其 类 型 的 抽象 表示 */ 
struct Tnode *Lchild,*Rehild; 。“”/* 指 向 结 点 左 、 右 孩子 的 指针 */ 

}*Bitree; 


对 于 某 些 特殊 的 二 叉 树 ， 如 哈 夫 曼 树 〈 或 称 为 最 优 二 又 树 )， 由 于 该 类 型 二 又 树 中 的 内 部 
结 点 是 由 初始 的 m 个 叶子 结 点 根据 一 定 的 规则 构成 的 ， 因 此 其 结 点 总 数 总 是 2m-1， 所 以 采用 
静态 的 三 又 链表 来 表示 ， 其 类 型 定义 如 下 : 


#define LEAFNUM 20 人 # 叶 子 结 点 数目 ， 在 应 用 中 可 预先 确定 */ 


struct node{ 
char ch; 话 当 前 结 点 表示 的 字符 ， 对 于 非 叶 子 结 点 ， 此 域 不 用 */ 
int weight: /# 当 前 结 点 的 权 值 #/ 
int parent: 人 # 当 前 结 点 的 父 结 点 的 下 标 ， 为 0 时 表示 无 父 结 点 */ 
int lchild, rchild: 
人 # 当 前 结 点 的 左 、 右 孩子 结 点 的 下 标 ， 为 0 时 表示 无 对 应 的 孩子 结 点 */ 

}Ht[2* LEAFNUMI]:; 


以 具有 4 个 叶子 结 点 (分 别 用 a、b、c、d 表示 ， 权 值 为 2、7、4、5) 为 例 ， 采 用 哈 夫 曼 
算法 构造 的 最 优 二 叉 树 及 其 存储 结构 如 图 12-25 所 示 。 


图 5s6 荐 。 软件 设计 师 教程 (第 5 版 ) 


parent | lchild | rchild 
Ss 0 0 
7 0 0 
0 0 
6 0 0 
6 1 3 
7 4 5 
0 2 6 
(a) 最 优 二 叉 树 (b) 存储 结构 数组 Ht 


图 12-25 最 优 二 叉 树 及 其 表示 
(2) 其 他 树 结 构 的 存储 结构 设计 。 一 般 的 树 结构 常 采用 孩子 一 兄弟 表示 法 表示 ， 即 采用 二 
叉 链 表 作 为 树 的 存储 结构 ， 链 表 中 结 点 的 两 个 链 域 分 别 指向 该 结 点 的 第 一 个 孩子 结 点 和 下 一 个 
见 弟 结 点 。 结 点 类 型 定义 如 下 : 
typedef struct Node { 
ElemType data; 
struct Node *firstchild,*nextbrother: 
}Node,*TreeNode: 


例如 ， 图 12-26 (a) 所 示 树 的 孩子 一 兄弟 表示 如 图 12-26 (b) 所 示 。 


固 四 四 
回国 
0) [a 
人 
@ 内 日 BIA 
@) @) ©O A| P|^| [AlcIA| 
(a) 树 (b) 树 的 孩子 一 兄弟 表示 


图 12-26 树 及 其 孩子 一 兄弟 表示 示意 图 


显然 ， 在 物理 上 ， 表 示 一 般 二 
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又 树 的 二 又 链表 与 树 的 孩子 一 兄弟 表示 法 的 结构 是 相同 的 ， 


其 差别 在 于 对 指针 所 指 对 象 的 解释 ， 也 就 是 在 逻辑 上 进行 区 分 。 
B 树 是 适用 于 外 部 查找 的 平衡 查找 树 ， 一 个 4 阶 的 B 树 如 图 12-27 所 示 。 


a 
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其 存储 结构 的 类 型 定义 如 下 。 
#define M 4 
typedef struct BTreeNode{ 
int numkeys; 
struct BTreeNode *parent ; 
struct BITreeNode  *A[M]: 
ElemKeyType KI[IM]; 
}BTreeNode: 


3) 其 他 链表 的 设计 和 应 用 
图 也 可 以 采用 链表 存储 结构 ， 
typedef struct Gnode{ 

int adjvex; 

int weight; 

struct Gnode *nextarc; 
}Gnode; 
typedef struct Adjlist{ 

char vdata; 

struct Gnode *Firstadj: 
}AdjList; 
typedef struct LinkedWDigraph{ 


图 12-27 4 阶 B 树 示例 


/+B 树 的 阶 */ 


尺 结 点 中 关键 字 的 数目 */ 

放 指 向 父 结 点 的 指针 ， 树 根 的 父 结 点 指针 为 空 #/ 
/* 指 向 子 树 结 点 的 指针 数组 类 

尺 存 储 关键 字 的 数组 ，K[0] 闲 置 不 用 */ 


称 为 邻接 表 ， 其 数据 类 型 定义 如 下 : 


放 邻 接 表 的 表 结 点 类 型 #/ 
此 邻接 硕 点 编号 */ 

/* 弧 上 的 权 值 s/ 

从 指 示 下 一 个 弧 的 结 点 */ 


/# 邻 接 表 的 头 结 点 类 型 所 
话 顶 点 的 数据 信息 */ 
/# 指 向 邻接 表 的 第 一 个 表 结 点 类 


人 # 图 的 类 型 专 
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int n, e; /# 图 中 顶点 数 和 边 数 / 
struct AdjList *head; /# 指 向 图 中 第 一 个 顶点 邻接 表 的 头 结 点 的 指针 对 
}LinkedWDigraph:; 


例如 ， 某 有 向 图 (网 ) 如 图 12-28 (a) 所 示 ， 其 邻接 表 存储 结构 如 图 12-28 (b) 所 示 。 


(a) 有 向 图 (b) 邻接 表 存 储 结构 
图 12-28 图 的 邻接 表 存 储 结构 设计 


在 散 列 技术 中 ， 可 用 拉链 法 将 冲突 的 元 素 存储 起 来 ， 实 际 上 就 是 链表 结构 的 一 个 应 用 。 例 


如 ， 可 以 设计 散 列 桶 结构 的 类 型 如 下 : 
fdefine NULLKEY -1 /#* 散 列 桶 的 空闲 单元 标识 #/ 
#define Pnum 7 放 散 列 文件 中 基 桶 的 数目 */ 
#define ITEMS 3 必 基 桶 和 溢出 桶 的 容量 */ 
typedef struct BucketNode{ * 基 桶 和 溢出 桶 的 类 型 定义 */ 
int KeyData[ITEMS]; 
struct BucketNode *Link: 
}BUCKET: 
BUCKET Bucket[Pnum]; * 基 桶 空间 定义 */ 


设 散 列 函数 为 Hash(Key)=Key mod 7， 关 键 字 序列 “15，14，21，87，96，293，35，24， 
149，19，63，16，103，77，5，153，145，356，51，68，705，453” 的 存储 结构 如 图 12-29 
所 示 。 

从 上 述 内容 可 知 ， 利 用 指针 实现 的 链表 结构 有 灵活 多 变 的 形式 ， 可 根据 应 用 的 需要 为 数据 
存储 设计 不 同 的 结构 。 显 然 ， 数 据 的 存储 方式 不 同 ， 体 现 相 同 算法 思路 的 处 理 过 程 可 能 会 有 较 
大 的 差异 。 因 此 ， 算 法 的 实现 过 程 与 数据 结构 的 设计 是 密切 相关 的 ， 在 有 些 情 况 下 ， 算 法 的 实 
际 效率 会 因为 数据 存储 结构 的 不 同 而 不 同 。 
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图 12-29 ” 散 列 桶 结构 示例 


12.4.2 ”算法 设计 与 实现 


正如 第 8 章 提 到 的 ， 算 法 理论 的 研究 主要 包括 算法 设计 技术 和 算法 分 析 技术 ， 这 两 者 是 不 
可 分 割 的 一 个 整体 。 算 法 设计 要 提出 针对 问题 的 高 质量 的 算法 ， 算 法 分 析 的 对 象 是 被 提出 的 算 
法 ， 并 研究 算法 所 耗费 的 计算 资源 与 问题 规模 之 间 的 函数 关系 ， 而 每 一 个 被 设计 出 的 算法 只 有 
经 过 算法 分 析 才 能 评价 其 质量 的 优 劣 。 

因此 ， 用 什么 方法 来 设计 算法 ， 如 何 判 定 一 个 算法 的 优 务 ， 所 设计 的 算法 需要 占用 多 少时 
间 资 源 和 空间 资源 ， 在 实现 一 个 软件 系统 时 都 是 必须 予以 解决 的 重要 问题 。 


1. 算法 设计 过 程 


在 设计 算法 时 ， 有 几 个 问题 是 要 考虑 到 的 : 如 何 设计 算法 ? 如 何 表示 算法 ? 如 何 证 明 问 题 
解决 的 正确 性 ? 如 何 评估 算法 的 效率 ? 如 何 进行 算法 的 最 优化 ? 根据 这 些 问 题 ， 可 以 归纳 出 算 
法 设计 的 主要 步骤 : 理解 问题 ， 确 定 相关 因素 ， 包 括 问题 的 输入 与 输出 、 用 何 种 数据 结构 、 用 
什么 样 的 算法 设计 策略 等 ; 设计 算法 ; 证 明 所 设计 的 算法 的 正确 性 ; 分 析 所 设计 的 算法 的 效率 ; 
实现 所 设计 的 算法 。 

1) 理解 问题 

在 面 对 一 个 算法 任务 时 ， 算 法 设计 者 往往 不 能 准确 地 理解 要 求 他 做 的 是 什么 。 对 算法 希望 
实现 什么 只 有 一 个 大 致 的 想法 就 匆忙 地 落笔 写 算法 ， 其 后 果 往 往 是 写 出 的 算法 漏洞 百出 。 在 设 
计算 法 时 需要 做 的 第 一 件 事 就 是 完全 理解 要 解决 的 问题 ， 仔 细 阅 读 问题 的 描述 ， 手 工 处 理 一 些 
小 例子 。 

对 于 设计 算法 来 说 ， 这 是 一 项 重要 的 技能 。 准 确 地 理解 算法 的 输入 是 什么 ? 要求 算 法 做 的 
是 什么 ? 即 明确 算法 的 入 口 和 出 口 ， 这 是 设计 算法 的 切入 点 。 
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2) 确定 相关 因素 

(1) 预测 所 有 可 能 的 输入 。 

算法 的 输入 确定 了 该 算法 所 解 问题 的 一 个 实例 。 一 般 而 言 ， 对 于 问题 P， 总 有 其 相应 的 实 
例 集 I, 因此 算法 A 若是 问题 P 的 算法 , 则 意味 着 把 P 的 任 一 实例 mputEI 作 为 算法 A 的 输入 ， 
都 能 得 到 问题 P 的 正确 输出 。 

预测 算法 所 有 可 能 的 输入 , 包括 合法 的 输入 和 非法 的 输入 。 事实 上 , 无 法 保证 一 个 算法 (或 
程序 ) 永远 不 会 遇 到 一 个 错误 的 输入 ， 一 个 对 大 部 分 输入 都 运行 正确 而 只 有 一 个 输入 不 行 的 算 
法 ， 就 像 一 颗 等 待 爆炸 的 炸弹 。 这 绝 不 是 危 言 符 听 ， 有 大 量 这 种 引起 灾难 性 后 果 的 案例 。 例 如 ， 
许多 年 以 前 ， 整 个 AT&T 的 长 途 电话 网 崩溃 ， 造 成 了 几 十 亿美 元 的 直接 经 济 损失 。 原 因 只 是 一 
段 程序 的 设计 者 认为 他 的 代码 能 一 直 传送 正确 的 参数 值 ， 可 是 有 一 天 ， 一 个 不 应 该 有 的 值 作为 
参数 传递 了 ， 导 致 了 整个 北美 电话 系统 的 骨 溃 。 

如 果 养 成 习惯 一 一 首先 考虑 问题 和 它 的 数据 ， 然 后 列举 出 算法 必须 处 理 的 所 有 特殊 情况 ， 
那么 可 以 更 快速 地 成 功 构造 算法 。 

(2) 在 精确 解 和 近似 解 间 做 选择 。 

计算 机 科学 的 研究 目标 是 用 计算 机 来 求解 人 类 所 面临 的 各 种 问题 。 但 是 ， 有 些 问 题 无 法 求 
得 精确 解 ， 例 如 求 平方 根 、 解 非 线性 方程 和 求 定 积分 等 。 有 些 问 题 由 于 其 固有 的 复杂 性 ， 求 精 
人 确 解 需要 花费 太 长 的 时 间 ， 其 中 最 著名 的 要 算 旅 行商 问题 (TSP 问题 )， 此 时 ， 只 能 求 出 近 
似 解 。 

有 时 需要 根据 问题 以 及 问题 所 受 的 资源 限制 ， 在 精确 解 和 近似 解 间 做 选择 。 

(3) 确定 适当 的 数据 结构 。 

在 结构 化 程序 设计 时 代 ， 著 名 的 计算 机 学 者 沃 思 〈Wirth) 提出 了 “算法 + 数据 结构 = 程序 ” 
的 观点 ， 断 言 了 算法 和 数据 结构 是 构成 计算 机 程序 的 重要 基础 。 在 面向 对 象 的 程序 设计 时 代 ， 
数据 结构 对 于 算法 设计 和 分 析 仍 然 是 至 关 重 要 的 。 

确定 数据 结构 通常 包括 对 问题 实例 的 数据 进行 组 织 和 重 构 ， 以 及 为 完成 算法 所 设计 的 辅助 
数据 结构 。 在 很 多 情况 下 ， 数 据 结构 的 设计 直接 影响 基于 该 结构 之 上 设计 的 算法 的 时 间 性 能 。 

(4) 确定 算法 设计 技术 。 

第 9 章 介绍 的 算法 设计 技术 (或 称 为 算法 设计 策略 ) 是 设计 算法 的 一 般 性 方法 ， 可 用 于 解 
决 不 同 计算 领域 的 多 种 问题 。 这 些 算 法 设计 技术 包括 分 治 法 、 动 态 规划 法 、 贪 心算 法 、 回 淹 法 、 
分 支 界 限 法 、 概 率 算法 和 近似 算法 等 ， 已 经 被 证 明 是 对 算法 设计 非常 有 用 的 通用 技术 ， 它 们 构 
成 了 一 组 强 有 力 的 工具 ， 在 为 新 间 题 设计 算法 时 ， 可 以 运用 这 些 技术 设计 出 新 的 算法 。 算 法 设 
计 技 术 作为 问题 求解 的 一 般 性 策略 , 在 解决 计算 机 领域 以 外 的 问题 时 , 也 能 发 挥 相当 大 的 作用 。 

3) 设计 算法 

根据 1) 和 2) 的 结果 ， 就 可 以 设计 算法 。 在 构思 和 设计 了 一 个 算法 之 后 ， 必 须 清 楚 、 准 


序 的 C 代码 。 


void Insertion Sort(int A[],int length){ 
int index:; 
for(index = 1 ; index < length ; index++){ 
int temp = Alindex]; 
if(Alindex] < Alindex - 1D{ 


/* 因 为 A[0..index-1] 有 序 ， 若 Alindex]<Alindex-1], 
则 该 元 素 应 插入 index 之 前 的 某 个 位 置 */ 


int insert; 


for(insert = index-l ; insert >= 0 && Alinsert] > temp ; insert--){ 

人 #* 从 index-1 向 前 遍历 ， 遇 到 小 于 temp 的 元 素 时 停止 */ 
Alinsert + 1] =A[insert]; 

} 


Alinsert + 1] = temp; 
} 


} 


(1) 初始 化 。 


在 循环 的 第 一 轮 欠 代 开始 之 前 它 是 正确 的 。 对 于 插入 排序 ， 第 一 轮 迭 代 之 前 ， 产 2， 子 数 
组 为 40.7- 1]， 即 4[1]， 也 就 是 最 初 在 4[1] 中 的 那个 元 素 ， 显 然 这 个 子 数组 是 已 排 好 序 的 ， 因 
此 循环 不 变 式 成 立 。 

(2) 保持 。 


如 果 在 循环 的 每 一 次 迭代 之 前 它 是 正确 的 ， 那 么 在 下 一 次 迭代 之 前 ， 它 也 应 该 保持 正确 。 
对 于 插入 排序 (上述 伪 代码 包含 两 重 循环 ， 应 该 定义 两 个 循环 不 变 式 ， 并 证 明 它们 的 正确 性 。 
但 为 了 简便 , 暂时 不 陷入 过 于 形式 化 的 细节 , 仅 考虑 外 层 循环 ),， 要 将 417-1、4[7-2] 和 4[7-3] 
等 元 素 向 右 移 一 个 位 置 ， 直 到 找到 4 四 的 适当 位 置 为 止 ， 这 时 将 4 四 的 值 插入 。 很 显然 ， 循 环 
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确 地 将 所 设计 的 求解 步骤 记录 下 来 ， 即 描述 算法 。 描 述 算法 的 常用 方法 有 自然 语言 
程序 设计 语言 和 伪 代 码 等 ， 其 中 ， 伪 代码 是 比较 合适 的 描述 算法 的 方法 。 
4) 证 明 算 法 的 正确 性 


可 以 用 循环 不 变 式 来 证 明 算 法 的 正确 性 ， 以 插入 排序 为 例 介绍 循环 不 变 式 ， 以 下 是 插入 排 
#include<stdio.h> 


对 于 要 分 析 的 算法 ， 定 义 循环 不 变 式 ， 如 对 插入 排序 ， 定 义 其 外 层 循环 的 循环 不 变 式 为 : 
在 每 一 轮 友 代 的 开始 , 子 数组 4[1.j - 1] 中 包含 了 最 初 位 于 4[1.j- 1], 但 目前 已 经 排 好 序 的 各 个 
元 素 ， 然 后 证 明 循 环 不 变 式 的 3 个 性 质 。 


co 
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不 变 式 是 成 立 的 。 

(3) 终止。 

当 循 环 结束 时 ， 循 环 不 变 式 给 了 我 们 一 个 有 用 的 性 质 ， 它 有 助 于 表明 算法 是 正确 的 。 对 于 
插入 排序 ， 当 7 大 于 时 ， 外 层 for 循环 结束 。 在 循环 不 变 式 中 ， 将 j 替换 为 w+1， 就 有 子 数组 
A[1..n] 包 含 了 原先 在 4[1..n] 中 的 元 素 ， 但 现在 已 经 排 好 序 了 ， 这 意味 着 算法 是 正确 的 。 

除了 循环 不 变 式 外 ， 经 验 和 研究 表明 ， 发 现 算法 (或 程序 ) 中 逻辑 错误 的 重要 方法 就 是 系 
统 地 跟踪 算法 。 跟 踪 必 须要 用 “ 心 和 手 ” 来 进行 ， 跟 踪 者 要 像 计算 机 一 样 ， 用 一 组 输入 值 来 执 
行 该 算法 ， 并 且 这 组 输入 值 要 最 大 可 能 地 暴露 算法 中 的 错误 。 即 使 有 几 十 年 经 验 的 高 级 软件 工 
程 师 ， 也 经 常 利 用 此 方法 查找 算法 中 的 逻辑 错误 。 

5) 分 析 算 法 的 效率 

设计 出 的 算法 只 有 经 过 分 析 ， 才 能 评价 其 优 劣 ,才能 判断 其 是 否 能 满足 问题 求解 的 需求 或 
者 在 多 个 算法 之 间 进行 选择 。 算 法 分 析 主 要 分 析 两 种 效率 :时间 效 率 和 空间 效率 。 时 间 效 率 显 
示 了 算法 运行 得 有 多 快 ， 空 间 效率 则 显示 了 算法 需要 多 少 额 外 的 存储 空间 ， 相 比 而 言 ， 一 般 更 
关注 算法 的 时 间 效 率 。 事 实 上 ， 计 算 机 的 所 有 应 用 问题 ， 包 括 计 算 机 自身 的 发 展 ， 都 是 围绕 着 
“时 间 一 速度 ”这 样 一 个 中 心 进行 的 。 一 般 来 说 ， 一 个 好 的 算法 首先 应 该 是 比 同类 算法 的 时 间 
效率 高 。 

6) 根据 算法 编写 代码 

现代 计算 机 技术 还 不 能 将 伪 代 码 形式 的 算法 直接 “输入 ” 进 计算 机 中 ， 而 需要 把 算法 转变 
为 特定 程序 设计 语言 编写 的 程序 ， 算 法 中 的 一 条 指令 可 能 对 应 实际 程序 中 的 多 条 指令 。 在 把 算 
法 转变 为 程序 的 过 程 中 ， 虽 然 现代 编译 器 提供 了 代码 优化 功能 ， 但 仍 需 要 一 些 标准 的 技巧 ， 例 
如 ， 在 循环 体 之 外 计算 循环 中 的 不 变 式 、 合 并 公共 子 表达 式 、 用 开销 低 的 操作 代替 开销 高 的 操 
作 等 。 一 般 来 说 , 这 样 的 优化 对 算法 速度 的 影响 是 一 个 常数 因子 , 可 能 会 使 程序 提高 10% 一 50% 
的 速度 。 

算法 设计 的 一 般 过 程 如 图 12-30 所 示 。 需 要 强调 的 是 ， 一 个 好 算法 是 反复 努力 和 重复 修正 
的 结果 。 那 么 ， 什 么 时 候 应 该 停止 这 种 改进 呢 ? 设计 算法 是 一 种 工程 行为 ， 需 要 在 资源 有 限 的 
情况 下 ， 在 互 斥 的 目标 之 问 进行 权衡 。 设 计 者 的 时 间 显 然 也 是 一 种 资源 ， 在 实际 应 用 中 ， 常 常 
是 项 目 进度 表 人 迫使 我 们 停止 改进 算法 。 

2， 算 法 问题 类 型 

就 像 生物 学 家 把 自然 界 的 所 有 生物 作为 自己 的 研究 对 象 , 计算 机 科学 把 问题 作为 自己 的 研 
究 对 象 ， 研 究 如 何 用 计算 机 来 解决 人 类 所 面临 的 各 种 问题 。 在 计算 领域 的 无 数 问题 中 ， 或 者 由 


于 问题 本 身 具 有 一 些 重要 特征 ， 或 者 由 于 问题 具有 实用 上 的 重要 性 ， 有 一 些 领域 的 问题 是 算法 
研究 人 员 特 别 关 注 的 。 经 验证 明 ， 无 论 对 于 学 习 算 法 还 是 应 用 算法 ， 对 这 些 问题 的 研究 都 是 极 
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其 重要 的 。 下 面 列 出 几 类 重要 的 问题 。 


理解 问题 


确定 : 
可 能 的 输入 
精确 解 还 是 近似 解 
数据 结构 


算法 设计 技术 


证 明 算 法 的 正确 性 


分 析 算法 的 效率 


满意 


图 12-30 算法 设计 过 程 


1) 查找 问题 

查找 是 在 一 个 数据 集合 中 查找 满足 给 定 条 件 的 记录 。 对 于 查找 问题 来 说 ,没有 一 种 算法 对 
于 任何 情况 都 是 合适 的 。 有 的 算法 查找 速度 比 其 他 算法 快 ， 但 却 需 要 较 多 的 存储 空间 (例如 
Hash 查找 )， 有 的 算法 查找 速度 非常 快 ， 但 仅 适用 于 有 序数 组 (例如 折 半 查找 )， 等 等 。 此 外 
如 果 在 查找 的 过 程 中 数据 集合 可 能 频繁 地 发 生变 化 ， 除 了 考虑 查找 操作 外 ， 还 需要 考虑 在 数据 
集合 中 执行 插入 和 删除 等 操作 。 这 种 情况 下 ， 就 必须 仔细 地 设计 数据 结构 和 算法 ， 以 便 在 各 种 
操作 的 需求 之 间 达 到 一 个 平衡 。 而 且 ， 组 织 用 于 高 效 查 找 的 特大 型 数据 集合 对 于 实际 应 用 具有 
非常 重要 的 意义 。 

2) 排序 问题 

简单 地 说 ， 排 序 就 是 将 一 个 记录 的 无 序 序列 调整 成 为 一 个 有 序 序列 的 过 程 。 在 对 记录 进行 
排序 时 , 需要 选 定 一 个 信息 作为 排序 的 依据 , 例如 ， 可 以 按 学 生平 均 成 绩 对 学 生 记 录 进 行 排序 ， 
这 个 特别 选 定 的 信息 〈 平 均 成 绩 ) 称 为 关键 码 。 
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排序 的 一 个 主要 目的 是 为 了 进行 快速 查找 ， 这 就 是 为 什么 字典 、 电 话 敌 和 班级 名 册 都 是 排 
好 序 的 。 当 然 ， 在 很 多 领域 的 重要 算法 中 ， 排 序 也 被 作为 一 个 辅助 步骤 ， 例 如， 搜索 引擎 将 搜 
索 到 的 结果 按 相关 程度 排序 后 显示 给 用 户 。 

迄今 为 止 ， 已 经 发 现 的 排序 算法 不 下 几 十 种 ， 没 有 一 种 排序 算法 在 任何 情况 下 都 是 最 好 的 
解决 方案 ， 有 些 排序 算法 比较 简单 ， 但 速度 相对 较 慢 ， 有 些 排 序 算法 速度 较 快 ， 但 却 很 复杂 ; 
有 些 排序 算法 适合 随机 排列 的 输入 ; 有 些 排序 算法 更 适合 基本 有 序 的 初始 排列 ， 有 些 排序 算法 
仅 适 合 存储 在 内 存 中 的 序列 ， 有 些 排序 算法 可 以 用 来 对 存储 在 磁盘 上 的 大 型 文件 排序 等 。 

3) 图 问题 

算法 中 最 古老 也 是 最 令 人 感 兴趣 的 领域 是 图 问题 ， 很 多 纷乱 复杂 的 现实 问题 抽象 出 的 模型 
都 是 图 结构 ， 如 社会 网 络 、Web、 工 作 流 、XML 数据 、 电 路 、 图 像 、 化 合 物 和 生物 网 络 等 。 作 
为 一 种 通用 的 、 复 杂 的 数据 结构 ， 基 于 图 的 相关 算法 也 具有 十 分 重要 的 作用 。 

有 些 图 问题 在 计算 上 是 非常 困难 的 ， 这 意味 着 ， 在 能 够 接受 的 时 间 内 ， 即 使 用 最 快 的 计算 
机 ， 也 只 能 解决 这 种 问题 的 一 个 很 小 规模 的 实例 ， 例 如 TSP 问题 、 最 大 团 问 题 ( 即 最 大 独立 集 
问题 )、 图 着 色 问 题 、 哈 密 尔 顿 回路 问题 、 顶 点 覆盖 问题 和 最 长 路 径 问题 等 。 图 问题 中 还 有 一 
个 奇怪 的 现象 : 许多 形式 上 非常 类 似 的 问题 ， 解 决 它们 的 难度 却 相差 很 大 ， 例 如 ， 最 短路 径 问 
题 和 欧 拉 回路 问题 存在 多 项 式 时 间 算 法 ， 而 最 长 路 径 问题 和 哈密 尔 顿 回 路 问题 至 今 没 有 找到 一 
个 多 项 式 时 间 算 法 。 

4) 组 合 问题 

组 合 问题 一 般 都 是 最 优化 问题 ， 因 此 也 称 为 组 合 优化 问题 ， 即 寻找 一 个 组 合 对 象 ， 例 如 一 
个 排列 、 一 个 组 合 或 一 个 子 集 ， 这 个 对 象 能 够 满足 特定 的 约束 条 件 并 使 得 某 个 目标 函数 取得 极 
值 : 价值 最 大 或 者 成 本 最 小 。 典 型 的 组 合 优化 问题 包括 0-1 背包 问题 、TSP 问题 和 整数 线性 规 
划 等 。 

无 论 从 理论 的 观点 还 是 实践 的 观点 ， 组 合 问题 都 是 计算 领域 中 最 难 的 问题 ， 其 原因 如 下 。 

(1) 随 着 问题 规模 的 增 大 ， 组 合 对 象 的 数量 增长 极 快 ， 即 使 是 中 等 规模 的 实例 ， 其 组 合 对 
象 的 数量 也 会 达到 不 可 思议 的 数量 级 ， 产 生 组 合 爆炸 。 

(2) 还 没有 一 种 已 知 算法 能 在 可 接受 的 时 间 内 精确 地 求解 绝 大 多 数 问题 。 

5) 几何 问题 

几何 问题 处 理 类 似 于 点 、 线 、 面 和 体 等 几何 对 象 。 几 何 问 题 与 其 他 问题 的 不 同 之 处 在 于 ， 
哪怕 是 最 简单 、 最 初等 的 几何 问题 也 难以 用 数字 去 处 理 。 尽 管 人 类 对 几何 问题 的 研究 从 古代 起 
便 没 有 中 断 过 ， 但 是 具体 到 借助 计算 机 来 解决 几何 问题 的 研究 ， 还 只 是 停留 在 一 个 初始 阶段 。 
随 着 计算 机 图 形 图 像 处 理 、 机 器 人 和 断层 X 摄像 技术 等 方面 应 用 的 深入 ， 人 们 对 几何 算法 产生 
了 强烈 的 兴趣 。 经 典 的 几何 问题 包括 最 近 点 对 问题 和 凸 包 问题 ， 前 者 指 的 是 在 给 定 平面 上 的 n 
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的 最 小 凸 多 边 形 。 
3. 典型 实例 


下 面 给 出 一 些 典 型 的 问题 ， 并 用 常用 的 算法 设计 技术 来 设计 算法 ， 求 解 问题 。 

1) 循环 赛 日 程 安排 问题 

设 有 n(2* ) 位 选手 参加 网 球 循环 赛 ， 循 环 赛 共 进行 -1 天 ， 每 位 选手 要 与 其 他 n-l 位 选手 
赛 一 场 ， 且 每 位 选手 每 天 赛 一 场 ， 不 轮空 。 试 按 此 要 求 为 比赛 安排 日 程 。 

该 问题 可 以 用 分 治 法 来 求解 。 设 n 位 选手 被 顺序 编号 为 1，2，…，n。 比 赛 的 日 程 表 是 一 
个 n 行 n-l 列 的 表 ， 第 i 行 j 列 的 内 容 是 第 i 号 选手 第 j 天 的 比赛 对 手 。 用 分 治 法 设计 日 程 表 ， 
就 是 从 其 中 一 半 选 手 ( 2 所 位 ) 的 比赛 日 程 导出 全 体 〈2* 位 ) 选手 的 比赛 日 程 。 从 众所周知 的 
只 有 两 位 选手 的 比赛 日 程 出 发 ， 反 复 这 个 过 程 ， 直 到 为 n 位 选手 安排 好 比赛 日 程 为 止 。 

为 了 从 2 中 位 选手 的 比赛 日 程 表 中 导出 2* 位 选手 的 比赛 日 程 表 , 假定 只 有 8 位 选手 (如 图 
12-31 所 示 )， 若 1 一 4 号 选手 之 间 的 比赛 日 程 填 在 日 程 表 的 左上 角 (4 行 4 列 )，5~8 号 选手 之 
间 的 比赛 日 程 填 在 日 程 表 的 左下 角 (4 行 4 列 )， 而 左下 角 的 内 容 可 以 由 左上 角 对 应 项 加 上 数 4 
得 到 。 至 此 ， 剩 下 的 右上 角 (4 行 4 列 ) 是 为 编号 小 的 1 一 4 号 选手 与 编号 大 的 5 一 8 号 选手 之 
间 的 比赛 安排 日 程 。 例 如 在 第 4 天 ， 让 1 一 4 号 选手 分 别 与 5~8 号 选手 比赛 ， 以 后 各 天 ， 依 次 
由 前 一 天 的 日 程 安排 ， 让 5 一 8 号 选手 循环 轮转 即 可 。 最 后 ， 参 照 右上 角 得 到 右 下 角 的 比赛 日 
程 ， 如 图 12-31 所 示 。 由 以 上 分 析 ， 不 难得 到 为 2 选手 安排 比赛 的 算法 思路 。 


Na 
SS 
SN 
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(〈c) 有 3 


图 12-31 循环 赛 日 程 安排 
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循环 赛 日 程 安排 算法 的 关键 在 于 寻找 这 四 部 分 元 素 之 间 的 对 应 关系 ， 其 C 代码 如 下 : 


int ** GameTable(int k){ 
诈 为 矩阵 A 分 配 空间 ， 且 不 使 用 下 标 包含 0 的 元 素 ， 即 下 标 从 1 开始 计算 。 
矩阵 A 的 第 一 列 为 选手 的 编号 */ 
int** A = (int **) malloc( sizeoflint *)*( (in)pow(2.k) + 1)): 
int jt; 
for (1= 1;i<= (inbpow(2J ; HH){ 

A[i] = (int *) malloc( sizeof(int)*( (int)pow(2,k) + 1)); 
} 
intn=2; 
AD]I = 
AI]D2]=2; 
A[2][1] =2; 
Ar[2][D2] = 1; 
for(t=1;t<k; tH){ 
人 # 以 分 治 法 填充 日 程 表 所/ 
int temp = D; 
n*= 2; 
4 扩展 左下 角 */ 
fori=temp+1:;i<=n:;it+) 
forG =1;j <=temp ;j++) 
ADD]=AF-temp]D] + temp: 
人 * 扩 展 右 上 角 */ 
fori=1;i<=temp ;i++) 
for0=temp+1:;j<=n;jt+) 
ADH]D]=ADD - temp] + temp; 
4 扩展 右 下 角 */ 
ford =temp+l ;i<=n ;it+) 
forg=temp+1:;j<—n;j1) 
ALID] =A[i- temp]l -temp]; 


Tetum A; 
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} 
. 
其 中 ，4 为 数组 ，n=2* 表 示 参 加 比赛 的 人 数 。 
2) 矩阵 链 乘 问题 


给 定 n 个 矩阵 {41, 42，…, 4}， 其 中 ，A4; 与 4in1 是 可 乘 的， 二 1、2、…、n-1， 考 虑 这 个 
矩阵 的 乘积 。 由 于 和 矩阵 乘法 满足 结合 律 ， 故 计算 矩阵 的 连 乘积 可 以 有 许多 不 同 的 计算 次 序 。 这 
种 计算 次 序 可 以 用 加 括号 的 方式 确定 。 若 一 个 矩阵 链 乘 的 计算 次 序 完全 确定 ， 这 时 就 说 该 链 乘 
已 完全 加 括号 。 完 全 加 括号 的 矩阵 链 乘 可 递归 地 定义 为 : 

@ 单个 矩阵 是 完全 加 括号 的 。 

@ 矩阵 链 乘 的 乘积 4 是 完全 加 括号 的 , 则 4 可 表示 为 两 个 完全 加 括号 的 矩阵 链 乘 的 乘积 ， 
B 和 CC 的 乘积 并 加 括号 ， 即 4= (BO)。 

例如 ， 和 矩阵 链 乘 41424344 可 以 有 以 下 5 种 完全 加 括号 的 方式 : (41(42(4344)))、 
(A1((4243)44)、((4145)(4344)) 和 (((4145)4;3)44)。 每 一 种 加 括号 的 方式 确定 了 一 个 计算 的 次 序 。 
不 同 的 计算 次 序 与 矩阵 链 乘 的 计算 量 有 密切 关系 。 

为 了 说 明 该 问题 ， 回 忆 两 个 矩阵 相 乘 的 相关 概念 。 和 矩阵 4 和 和 矩阵 B 可 乘 的 条 件 是 矩阵 4 
的 列 数 等 于 矩阵 B 的 行 数 ， 若 4 是 一 个 pXg 矩阵，B 是 一 个 gXr 和 矩阵 ， 则 其 乘积 C=4B 是 一 
个 pPXr 和 矩阵 ， 且 标准 的 两 个 矩阵 相 乘 所 需要 的 计算 量 为 pgr 次 乘法 操作 。 

考虑 3 个 矩阵 {41,， 4，43} 链 乘 的 例子 。 设 这 3 个 矩阵 的 维 数 分 别 为 10X100、100X5 和 
5X50。 若 按 第 一 种 加 插 号 方式 (4142)43) 计 算 ， 则 所 需要 的 乘法 次 数 为 10 X 100X 5+10X 
5X 50=7500。 若 按 第 二 种 加 括号 方式 Cdi(4243)) 计 算 ， 则 所 需要 的 乘法 次 数 为 10X5X 50+ 
10X100X50=75 000。 第 二 种 加 括号 方式 乘法 次 数 是 第 一 种 的 10 倍 。 由 此 可 以 看 出 ,不 同 的 加 
括号 方式 确定 的 不 同 的 计算 次 序 对 矩阵 链 乘 的 运算 量 影响 是 巨大 的 。 

和 矩阵 链 乘 问题 定义 如 下 :给 定 n 个 矩阵 {41, 42,，…, Aw} ,矩阵 4; 的 维 数 为 pi Xpis 二 1、2、…、 
n， 如 何 给 矩阵 链 乘 41X A4,X…X 4, 完全 加 上 括号 ， 使 得 矩阵 链 乘 中 乘法 次 数 最 少 。 

和 矩阵 链 乘 是 非常 难 的 问题 ， 若 用 穷尽 搜索 法 ， 能 够 证 明 需 要 指数 时 间 来 求解 。 现 在 考虑 用 
动态 规划 法 来 求解 矩 阵 链 乘 问题 ， 具 体 步骤 如 下 。 

(1) 刻画 矩阵 链 乘 问题 的 结构 。 

为 简便 起 见 , 用 4 表示 矩阵 乘积 4A;4i4…4 的 结果 , 其 中 i<j。 若 问题 是 非 平凡 的 , 即 < 
那么 乘积 4izd4aa… 才 一 定 在 因 与 4ea 之 间 被 分 裂 ，i Kj。 问题 4;4i4… 壬 完全 加 括号 的 开销 等 
于 计算 矩阵 4i* 与 计算 4kay 的 开销 ， 再 加 上 它们 的 结果 相 乘 的 开销 。 

问题 的 最 优 子 结构 可 刻画 如 下 : 假定 问题 4i4ast… 才 被 完全 加 括号 的 最 优 方式 是 在 A 与 A 
之 间 被 分 裂 ， 那 么 分 裂 之 后 ， 最 优 解 4;:4a1…4 中 的 子 链 4;4i:1…A44 一 定 是 问题 4z4ist… 和 的 最 
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优 加 括号 方式 。 同样 , 最 优 解 4eadkz… 才 中 的 子 链 一 定 是 问题 4kadka… 才 的 最 优 加 括号 方式 。 
(2) 递归 定义 最 优 解 的 值 。 
根据 问题 的 最 优 解 递归 地 定义 问题 最 优 解 的 开销 。 设 mli, 用 表示 计算 4 所 需 的 最 小 乘法 
次 数 ， 得 到 下 列 递归 式 。 对 于 原 问题 ， 计 算 41 ;的 最 小 开销 则 为 m[1, n]。 
0 过 = 了 
mo-| 


min{m[i,k]+m[lk+l, + pipepy} si<j 
igk<j 


(3) 计算 最 优 解 的 值 。 

根据 上 述 递归 式 ， 以 自 底 向 上 的 方式 计算 最 优 开销 。 假 设 输入 为 p=<po, p1,…, pn>， 用 表 
m[1..n,1..n] 存 储 m[i, 尹 ， 用 辅助 表 s[1..n,1..n] 存 储 哪 一 个 上 使 得 计算 m[i, 加 时 达到 最 优 。 最 终 需 
要 利用 s 构造 问题 的 一 个 最 优 解 。 算 法 的 C 代码 如 下 : 


int** Matrix_Chain Order(int* p,int Length){ 
int Multip_times=Length-1; 
/# 为 m、s 分 配 空间 */ 
int** m = (int *#)malloc(sizeofint *)*(Length)); 
int** s = (int **)malloc(sizeoflint *)*(Length)): 
inti; 
for (i= 0; 1< Length:; i++){ 
ml[i] = (int *)malloc(sizeof(int)*(Length)): 
s[i] = (int *)malloc(sizeof(int)*(Length)); 
} 
/#* 初 始 化 ms/ 
for(i= 1:i<= Multip_times:i++) 
m=0; 
int 1 
/# 自 底 至 上 计算 m、s#/ 
for(1 = 21<= Multip_times:LHH{ /4l 为 子 问题 长 度 ， 即 有 1 个 矩阵 相 乘 s/ 
for(i= 1:1<= (Multip_times -1+ 1):iHH{ 
intj=i+1l-1: 
mDHD] =INT_ MAX: 
int k; 
for(k=ik<j:k+H){ /* 计 算 m[ij] 的 最 小 代价 */ 
int q=mfil[k] + mfk + 1]0] +pli- 1] * p[k] * pO]; 
fq < mGD{ 人 * 当 前 代价 小 于 之 前 的 最 小 代价 */ 
mDD] = q: 
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s 国 四 二 区 


由 上 述 伪 代码 很 容易 得 到 算法 的 时 间 复 杂 度 为 O05)。 举 个 例子 说 明 上 述 过 程 ， 假 设 n=6， 
=<po, pl，…, pe>=<30,35,15,5,10,20,25>。 则 根据 上 述 伪 代码 ， 图 12-32 给 出 了 mm 及 的 计算 次 
序 以 及 m[i, 用 和 si, 刀 的 值 。 


1 1 
ml234556 i 
1 CN We i 
2 2 1 
元 3 7 ; 3 
4 4|3|13|3 
5 5|3|3|3|4 
6 6|3|3|3|5|5s 
(Ca) m[i 四 的 计算 次 序 《b)》m[i. 刀 的 值 (c) s 世 用 的 值 


图 12-32 ”和 矩阵 链 乘 的 动态 规划 算法 示例 
(4) 构造 最 优 解 。 
上 一 步 给 出 了 计算 矩阵 乘积 的 最 少 乘法 次 数 〈 最 优 解 的 值 )， 但 没有 给 出 具体 的 乘法 次 序 
(最 优 解 )。 可 以 由 辅助 表 s 的 信息 构造 最 优 解 ，C 代码 如 下 。 


void Print_Optimal Parens(int **s,int Lint j){ /* 表 项 s[ij] 记 录 了 对 乘积 AiAit1…Aj 在 Ak 和 Axtl 之 间 
进行 分 裂 ， 以 取得 最 优 加 全 部 括号 时 的 k 值 #/ 


这 i 一 ]) 
printf("A%d",i); 

else{ 
Printf("("); 
Print_ Optimal Parens(s,is[i]D]): * 在 当前 分 裂 左 侧 继 续 分 裂 */ 
Print_Optimal Parens(s,s[i][] + 13): 放 在 当前 分 裂 右 侧 继续 分 裂 */ 
Printf(")"); 

} 
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上 述 例子 调用 OutputOptimalParens(s,1,6) 后 得 到 输出 结果 ((41(4243))((4445)46))。 

3) 多 机 调度 问题 

假设 有 个 独立 的 作业 {1, 2, …, n}， 由 m 台 相 同 的 机 器 041, Mp, …, Mi} 进 行 加 工 处 理 ， 
作业 i 所 需 的 处 理 时 间 为 #， 每 个 作业 均 可 在 任意 一 台 机 器 上 加 工 处 理 ， 但 不 可 间断 或 拆 分 ， 
即 一 旦 一 个 作业 在 某 台 机 器 上 加 工 处 理 ， 便 不 会 再 转移 到 其 他 的 机 器 上 。 多 机 调度 问题 要 求 给 
出 一 种 作业 调度 方案 ， 使 所 给 的 个 作业 在 尽 可 能 短 的 时 间 内 由 m 台 机 器 加 工 处 理 完成 。 

多 机 调度 问题 是 NP 难 问题 ， 到 目前 还 没有 有 效 的 算法 。 对 于 这 类 问题 ， 用 贪心 算法 求解 
有 时 可 以 得 到 较 好 的 近似 解 。 贪 心 法 求解 多 机 调度 问题 时 的 贪心 策略 是 最 长 处 理 时 间 优 先 。 当 
m>n 时 ， 只 要 将 机 器 i 上 的 [0, 向 时间 区 间 分 配给 作业 i 即 可 ; 当 m<n 时 ,首先 将 n 个 作业 按 其 
所 需 的 处 理 时 间 从 大 到 小 排序 ， 然 后 依 此 顺序 将 作业 分 配给 空闲 的 机 器 。 例 如 ， 假 设 有 7 个 作 
业 {1,2,3,4,5,6,7}， 由 3 台 机 器 {M41，Ms，Ms} 加 工 处 理 ， 各 个 作业 所 需要 的 时 间 分 别 为 
{2,14,4,16,6,5,3}。 首 先 将 这 7 个 作业 按 其 处 理 时 间 从 大 到 小 排序 ， 则 作业 {4,2,5,6,3,7,1} 的 处 理 
时 间 为 {16,14,6,5,4,3,2}。 图 12-33 给 出 了 按 最 长 处 理 时 间作 业 有 限 的 原则 时 ， 这 7 个 作业 的 调 
度 情况 及 其 所 需要 的 总 加 工 处 理 时 间 。 


M, 
M; 

6 5 | 

时 间 ， 16 i 

ee 2 

-2 ES 加 


图 12-33 3 台 机 器 的 调度 问题 示例 


假设 对 n 个 作业 按 其 加 工 处 理 时 间 从 大 到 小 进行 了 排序 ， 排 序 的 时 间 复 杂 度 为 O(nlgn)。 
下 面 给 出 用 贪心 法 解决 多 机 调度 问题 的 C 代码 。 


typedef struct{ 
int ID; 
int time: 
}Task; 
int IndexOfMin(int *Array, int Number){ 


inti; 
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int index =0: 
int min = Array[0]; 
for(i= 1;i< Number ; 1++){ 


if(Array[i] < min){ 
index=1; 
min = Array[i]; 
上 
} 
return index; 


} 
int* MultiMachineSchedule(Task *Tasks,int Task number,int Machine numben){ 


/*Finish_times 数组 为 每 台 机 器 完成 作业 的 累积 时 间 */ 
人 * Task_lists 数组 为 每 台 机 器 完成 作业 的 列表 ， 如 第 一 台 机 器 依次 完成 作业 1、2、3， 则 其 数组 元 
素 为 123 */ 

int* Finish times = (int *) malloc( sizeofint) * (Machine_number)); 

int* Task lists = (int *) malloc( sizeoflint) * (Machine number)); 

int i; 

for(i=0;1<Machine number :i++H){ 

以 初始 化 数组 */ 
Finish times[i] = 0: 
Task lists[i] = 0; 

} 

for(i=0;1< Machine number ; i++){ 
/* 先 让 Machine_number 台 机 器 处 理 排名 前 Machine_number 的 作业 */ 
Task lists[i] = Task_lists[i] * 10 + Tasks[].ID: 
Finish_times[i] += Tasks[i].time; 

} 

for( ;1< Task number ; i+H+){ 
人 # 选 择 最 早 完成 作业 的 机 器 处 理 未 完成 作业 中 所 需 时 间 最 长 的 作业 xy/ 
int index=IndexOfMin( Finish times, Machine_number ); // 选 出 最 先 完成 任务 的 机 器 
Task lists[index] = Task lists[index] * 10 + Tasks[i].ID:; 
Finish times[index] += Tasks[i].time: 

} 


Teturn Task lists; 
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12.5 面向 对 象 的 程序 设计 与 实现 


12.5.1 设计 与 实现 方法 


面向 对 象 程序 设计 主要 是 根据 问题 的 详细 描述 , 设计 出 能 够 被 迅速 转换 为 面向 对 象 程序 实 
现 的 代码 ， 相 比 本 章 的 第 12.3 节 ， 其 设计 与 实现 更 为 底层 ， 更 接近 代码 。 但 是 ， 对 面向 对 象 设 
计 结 果 的 衡量 没有 统一 的 标准 ， 因 此 很 难 衡量 针对 一 个 问题 所 设计 的 解决 方案 是 否 最 优 ， 这 也 
正 是 软件 工程 领域 内 分 析 与 设计 的 难点 ， 在 更 多 的 情况 下 ， 分 析 与 设计 的 结果 是 一 种 经 验 的 
总 结 。 

尽管 不 存在 一 致 的 对 分 析 与 设计 结果 的 衡量 标准 ， 但 许多 面向 对 象 和 软件 工程 领域 内 的 
“大 师 ” 都 根据 自己 长 期 的 实践 经 验 总 结 出 了 面向 对 象 分 析 与 设计 的 原则 ， 而 这 些 原则 可 成 为 
我 们 在 对 实际 问题 进行 分 析 与 设计 时 的 指导 准则 。 

一 般 而 言 ， 当 面临 一 个 具体 的 问题 时 ， 可 分 为 两 大 阶段 : 首先 根据 问题 进行 设计 ， 其 次 根 
据 设 计 进 行 实现 。 由 于 面向 对 象 的 实现 和 面向 对 象 设计 之 间 不 存在 较 大 的 差异 ， 所 不 同 的 是 设 
计 更 多 采用 的 是 UML 的 标准 表示 ， 而 实现 则 是 采用 面向 对 象 语言 表达 ， 因 此 解决 问题 的 重点 
应 放 在 面向 对 象 的 设计 上 。 

目前 ,被 公认 的 好 的 面向 对 象 设计 是 由 前 人 所 总 结 的 设计 模式 。 因此， 熟练 并 正确 地 掌握 
面向 对 和 象 设计 技术 ， 必 须 很 好 地 体会 并 理解 常用 的 23 种 设计 模式 。 在 对 23 种 设计 模式 加 以 运 
用 时 ， 必 须 做 到 以 下 几 点 。 

(1) 能 够 根据 设计 模式 的 名 称 画 出 其 对 应 的 类 图 。 

(2) 理解 类 图 中 每 一 个 类 的 作用 与 功能 。 

(3) 能 够 将 现实 问题 中 所 描述 的 各 种 职责 映射 到 类 图 中 具体 的 类 。 

(4) 能 够 使 用 一 种 面向 对 象 语言 实现 设计 。 

下 面 通过 具体 的 应 用 来 说 明 这 个 过 程 。 


12.5.2 ”设计 模式 的 应 用 


1. 问题 说 明 


已 知 某 类 库 开 发 商 提 供 了 一 套 类 库 ， 类 库 中 定义 了 Application 类 和 Document 类 ， 它 们 之 
间 的 关系 如 图 12-34 所 示 。 其 中 ，Application 类 表示 应 用 程序 自身 ， 而 Document 类 表示 应 用 
程序 打开 的 文档 。Application 类 负责 打开 一 个 已 有 的 以 外 部 形式 存储 的 文档 ， 如 一 个 文件 ， 一 
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旦 从 该 文件 中 读 出 信息 后 ， 它 就 由 一 个 Document 对 象 表示 。 


Document | Application 


-docs 


+save() 
+open(docName : String) 
+close() 

+read() 


+canOpenDocument(docName : String) 
+addDocument(aDocument : Document) 
+doCreatDocument() 

+openDocument(docName : String) 


MyApplication 
i+doCreateDocument() 


图 12-34 ”Application 与 Document 关系 图 


MyDocument 


+read() 


当 开 发 一 个 具体 的 应 用 程序 时 , 开发 者 需要 分 别 创建 自己 的 Application 和 Document 子 类 ， 
例如 图 12-34 中 的 类 MyApplication 和 类 MyDocument， 并 分 别 实现 Application 和 Document 类 
中 的 某 些 方法 。 

已 知 Application 类 中 的 openDocument 方法 采用 了 模板 方法 (Template Method) 设计 模式 ， 
该 方法 定义 了 打开 文档 的 每 一 个 主要 步骤 ， 如 下 所 述 。 

(1) 首先 检查 文档 是 和 否 能 够 被 打开 ， 若 不 能 打开 ， 则 给 出 出 错 信息 并 返回 。 

(2) 创建 文档 对 象 。 

(3) 通过 文档 对 象 打开 文档 。 
(4) 通过 文档 对 象 读 取 文档 信息 。 
(5) 将 文档 对 象 加 入 到 Application 的 文档 对 象 集合 中 。 


2. 根据 设计 模式 的 名 称 画 出 其 对 应 的 类 图 


问题 描述 中 已 经 给 出 了 该 设计 采用 的 设计 模式 为 模板 方法 ， 因 此 ， 首 先 给 出 模板 方法 的 类 
图 ， 如 图 12-35 所 示 。 


3. 理解 类 图 中 每 一 个 类 的 作用 与 功能 


在 模板 方法 类 图 中 ，AbstractClass 类 定义 了 基本 的 操作 PrimitiveOperation10 和 Primitive- 
Operation20， 并 在 TemplateMethod0 方 法 中 调用 了 这 两 个 操作 ， 但 这 两 个 操作 都 并 未 实现 ， 而 
是 留待 子 类 去 实现 ， 从 而 达到 模板 方法 的 目的 : 定义 一 个 操作 中 的 算法 的 骨架 ， 而 将 一 些 步骤 
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延迟 到 子 类 中 ， 使 得 子 类 可 以 不 改变 一 个 算法 的 结构 即 可 重 定义 该 算法 的 某 些 特定 步骤 。 


AbstractClass 


TemplateMethod() 让 
PrimitiveOperation1() 
PrimitiveOperation2() 


4 


ConcreteClass 


PrimitiveOperation 10 


PrimitiveOperation20) 


PrimitiveOperation10) 
PrimitiveOperation2() 


图 12-35 ”模板 方法 类 图 


4. 能 够 将 现实 问题 中 所 描述 的 各 种 职责 映射 到 类 图 中 具体 的 类 


在 提出 的 具体 问题 中 ,已 经 告知 了 Application 类 中 的 openDocument 方法 采用 了 模板 方法 ， 
而 openDocument 方法 的 步骤 都 已 经 给 出 ， 因 此 ， 很 容易 将 Application 类 对 应 为 模板 方法 类 图 
中 的 AbstractClass 类 ，openDocument 方法 映射 为 模板 方法 类 图 中 的 TemplateMethod 方法 ， 而 
主要 步骤 对 应 PrimitiveOperation10 等 基本 操作 。 由 此 可 推出 ， 在 各 种 主要 的 步骤 中 ， 应 该 存在 
某 些 步骤 是 由 Application 的 子 类 实现 的 。 


5， 能 够 使 用 一 种 面向 对 象 语言 实现 设计 


一 旦 分 析 清 楚 实际 问题 的 设计 结果 和 原始 的 设计 模式 类 图 中 类 的 对 应 关系 , 便 可 采用 一 种 
面向 对 象 语言 实现 。 下 面 分 别 采用 C++ 和 Java 语言 实现 给 出 的 设计 。 
【C++ 代码 】 


#include <iostream> 
#include <vector> 
using namespace std: 


class Document{ 
public: 
void save0{ /* 存 储 文档 数据 ， 此 处 代码 省 略 */} 
void open(string docName){ /* 打 开 文 档 ， 此 处 代码 省 略 */ } 
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void closeO{ /# 关 闭 文档 ， 此 处 代码 省 略 */ } 
virtual void read(string docName) = 0; 
后 


class Appplication{ 
private: 
Vector <Document*> docs; * 文 档 对 象 集合 */ 
public: 
bool canOpenDocument(string docName){ 
访 判 断 是 否 可 以 打开 指定 文档 ， 返 回 真 值 表示 可 以 打开 ， 返 回 假 值 表 示 不 可 以 打开 ， 
此 处 代码 省 略 */ 
0 addDocument(Document * aDocument){ 
人 # 将 文档 对 象 添加 到 文档 对 象 集合 中 */ 
docs.push_back(aDocument): 


} 
virtual Document * doCreateDocument() = 0; /* 创 建 一 个 文档 对 象 */ 


void openDocument(string docName){ /# 打 开 文档 
if(!canOpenDocument(docName)){ 
cout << "文档 无 法 打开 ! "<< endl; 
return; 


} 
Document * adoc= doCreateDocument(); 


adoc->open(docName): 
adoc->read(docName): 
addDocument (adoc) : 


站 
【Java 代码 】 


abstract class Document{ 
public void saveO{ /* 存 储 文档 数据 ， 此 处 代码 省 上 略 */ } 
public void open(String docName){ /* 打 开 文 档 ， 此 处 代码 省 上 略 */ } 
public void closeO{ /* 关 闭 文档 ， 此 处 代码 省 略 */ } 
public abstract void read(String docName): 


abstract class Appplication{ 


os 
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Private Vector< Document > ”docs; /* 文 档 对 象 集合 */ 


public boolean canOpenDocument(String docName){ 
/* 判 断 是 否 可 以 打开 指定 文档 ， 返 回 真 值 表 示 可 以 打开 ， 
返回 假 值 表示 不 可 以 打开 ， 此 处 代码 省 略 */ 
public void addDocument(Document aDocument){ 
必 将 文档 对 象 添加 到 文档 对 象 集合 中 */ 
docs.add(aDocument); 
} 
public abstract Document doCreateDocument(); /* 创 建 一 个 文档 对 象 */ 
public void openDocument(String docName){ /* 打 开 文档 */ 
if (IcanOpenDocument (docName)){ 
System.out.println( "文档 无 法 打开 ! "); 
return; 
} 
Document adoc= doCreateDocument(); 
adoc.open(docName); 
adoc.read(docName); 
addDocument(adoc); 


